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ACONITASES VEGE TALES ET ACIDES NUCLEIQUES CODANT POUR 

CES ACONITASES 

L ■ invention concerne 1 ■ aconitase vegetale , des 
sequences d'acides nucleiques codant pour 1' aconitase, 
ainsi que le gene de 1' aconitase et des fragments 
derives de ce gene. L» invention concerne aussi les 
regions promotrices du gene de 1" aconitase et des 
genes chimeriques comprenant cette region promotrice. 
En outre, !• invention vise un procede pour modifier le 
metabolisme d'une plante par 1 1 introduction, dans la 
plante, d'une sequence d'acide nucleique capable de 
modifier 1" expression naturelle du gene de 
1 'aconitase. 

L' aconitase, (E.G. 4. 2. 1.3.), egalement connu sous 
le nom d'aconitate hydratase ou citrate (isocitrate) 
hydro-lyase, est une proteine a centre fer-soufre 
catalysant la reaction d' interconversion reversible du 
citrate en isocitrate via le cis-aconitate come 
intermediaire. Depuis plusieurs annees, les recherches 
ont conduit a la mise en evidence non seulement d'une 
aconitase mitochondriale (intervenant dans le cycle de 
Krebs) mais egalement d f une aconitase cytosolique, 
qui, chez les animaux, possede une double 
fonctionnalite : une activite d 1 aconitase, dont le 
role physiologique n'est pas connu, et une activite 
"Iron Responsive Element - Binding Protein" (IRE-BP) 
permettant une regulation post-transcriptionnelle dans 
le metabolisme du fer. Chez l'homme, 1' IRE-BP existe 
dans deux etats conf ormationnels, appeles des 
"isoformes" , et correspondant a un etat de reduction. 

Chez les animaux et chez certains micro- 
organismes, les aconitases mitochondriales et 



WO 95/20046 



PCT/EP95/00263 



2 

cytosoliques ont pu etre purifiees et donees. Par 
exemple, l'aconitase mitochondriale de pore (Zheng et 
al. 1990, J. Biol. Chem., 265 : 2814-2821) et de 
levure (Gangloff, 1990, PNAS, 85 : 8998-9002) a ete 
clonee, ainsi que l'aconitase cytosolique humaine 
(Rouault et al., 1990, PNAS, 87 : 7958-7962) et 
bacterienne (Promodrou et al., 1991, J. Gen. 
Microbiol., 137 : 2505-2515). 

Chez les animaux, l'aconitase cytosolique et 
l'aconitase mitochondriale sont codees par deux genes 
differents et sont facilement separables, par exemple 
par chromatographic sur DEAE - cellulose. 

En ce qui concerne l'aconitase vegetale, tres peu 
d 1 informations sont disponibles a l'heure actuelle. 
Chez les plantes, il existe aussi une activite 
aconitase mitochondriale, intervenant dans le cycle de 
Krebs, et une activite aconitase cytosolique, 
intervenant dans le cycle du glyoxylate. Le fait 
qu'aucune activite aconitase ne soit detectee dans les 
glyoxysomes suggere que le cycle du glyoxylate est 
detournee via le cytosol (Courtois - Verniquet et 
Douce, 1993, Biochem. Journal, 294 : 103-107). 

Un certain nombre de differences dans les 
proprietes structurales des aconitases mitochondriales 
d'origine animale et vegetale, en particulier dans la 
structure Fer-Soufre, ont pu etre mises en evidence 
(Brouquisse et al., 1986, Plant Physiol., 81 : 
247-252) . De plus, contrairement aux travaux realises 
dans le domaine animal, les formes mitochondriale et 
cytosolique de l'aconitase vegetale n'ont pu, jusqu'a 
present, etre separees par chromatographie d'echange 
d'ions sur DEAE (Brouquisse et al., 1987, Plant 
Physiol., 84 : 1402-1407), les deux formes presentant 
les memes pics d'elution, Ces resultats suggerent que 
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la forme mitochondrials et la forme cytosoligue de 
l'aconitase vegetale ont des structures tres voisines. 

A ce jour, les aconitases de deux especes 
vegetales ont ete purifiees. L'aconitase 
mitochondriale de pomme de terre a pu etre purifiee a 
partir de mitochondries de tubercules (Verniquet et 
al., 1991, Biochem. J., 276 : 643-948). II s'agit 
d'une proteine monomerique d'un poids moleculaire 
d 1 environ 90KDa, de nature acide, se rapprochant des 
aconitases bacteriennes et de levure. 

De Bellis et al., 1993, Physiologia Plantarum, 
88 : 485-492, ont purifie deux isoformes de 
1 ' aconitase . a partir de cotyledons etioles de 
citrouille. Ces deux isoformes ont un poids 
moleculaire voisin de lOOKDa et 98KDa avec des pi 
respect ivement de 5.0 et 4.8. Selon ces auteurs, une 
troisieme forme a egalement ete detectee en gel non 
denaturant mais n'a pas ete purifiee. La localisation 
subcellulaire de ces isoformes n'a pas ete clairement 
determinee mais les auteurs supposent qu'il s'agit 
d 1 isoformes cytosoliques. La signification biologique 
de ces 11 isoformes" n'est pas elucidee. 

Les informations disponibles aujourd'hui sur les 
aconitases vegetales ne permettent done pas de definir 
la relation entre la forme mitochondriale et la forme 
cytosolique. II n'est pas connu si les deux formes 
sont codees par deux genes differents, comme chez 
1' animal, ou s 1 il s'agit d'un seul gene. L' existence 
de differentes isoformes d f une meme forme d 1 aconitase 
a ete suggeree mais n'a pas ete confirmee. De plus, 
l'aconitase de citrouille et celle de pomme de terre 
purifiees par De Bellis et par Verniquet, 
respectivement ( supra ) , presentent des carac- 
teristiques differentes, l'une de l'autre, suggerant 
une specif icite d ! espece. A ce jour, le degre 
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d'homologie entre les differentes especes vegetales 
n'est pas connu 

Jusqu'a present, le clonage du gene de 
l'aconitase vegetale n'a jamais ete rapporte. 

La presente invention concerne le clonage de 
l'ADNc de l'aconitase vegetale et la caracterisation 
du gene, y compris la region promotrice. 

Le clonage du gene a presente un certain nombre 
de difficultes pratiques. Par exemple, la specif icite 
d'espece de l'aconitase suggeree dans l'art anterieur 
empeche la transposition fiable d' information 
concernant une premiere espece, sur une deuxieme. Pour 
doner 1 1 ADNc de l'aconitase de melon, les inventeurs 
ont done du purifier l'aconitase a partir de graines 
de melon afin d'obtenir la sequence en acides amines 
de 1' extremity NH 2 . Ceci a permis d'elaborer une serie 
de sondes nucleiques degenerees, mais aucune de ces 
sondes n'a permis d ' identifier, parmi une banque 
d 1 ADNc , de clone posit if. Une sequence partielle 
d 1 ADNc d'aconitase de melon a pu etre identifiee en 
criblant une banque d 1 expression d 1 ADNc avec des 
anticorps polyclonaux, mais un clone complet de I'ADNc 
de l'aconitase n'a pas ete identifie. 

Une hybridation inter-specif ique, e'est-a-dire le 
criblage d'une banque d ' ADNc d 1 Arabidopsis thaliana 
avec une sonde provenant de I'ADNc de l'aconitase de 
melon, a done t ete ' effectuee. Les conditions 
d' hybridation inter-specif ique ont ete specialement 
concues pour cette etape du clonage parce que 
l'homologie entre les sequences n'etait pas connue. Un 
clone entier d 1 ADNc d ' Arabidopsis thaliana a pu ainsi 
etre identifie. Cet ADNc a ensuite servi de sonde pour 
cribler une banque genomique d 'Arabidopsis thaliana et 
a permis 1 ' identification du gene, y compris la region 
promotrice. A partir de ce gene, les inventeurs ont 
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identifie un couple d ' amorces qui a pu etre utilise 
chez d 1 autres especes notamment chez le mais, dans une 
reaction d • amplification, permettant 1 1 identification 
du gene de 1 1 aconitase d 1 autres especes . 

Les resultats de ces travaux ont permis aux 
inventeurs : 

- d'effectuer des recherches d 1 homologies de 
sequence entre les aconitases de differentes especes. 
II a ete demontre que l 1 aconitase d 1 Arabidopsis 
thaliana presente, au niveau de la proteine, une forte 
homologie (70 %) avec 1 ' IRE-BP humaine, et avec 
l 1 aconitase d 1 autres especes vegetales (90 % environ), 
Les proteines vegetales sont plus proches des 
aconitases cytosoliques animales que des aconitases 
mitochondriales animales. Ces resultats suggerent que 
1 ■ aconitase vegetale , en particulier 1 1 aconitase 
cytosolique, joue le role d'une IRE-BP et permet une 
regulation post-transcriptionelle dans le metabolisme 
d"ions metalliques tels que le fer, ou bien qu'elle 
joue le role d'une RNA-BP, se fixant a une structure 
proche ou similaire des IRE animales, qui 
interviendrait dans une regulation post- 
transcriptionnelle du metabolisme de la plante ou de 
la graine ; 

- de caracteriser le gene de 1' aconitase chez 
Arabidopsis thaliana . Sa structure est tres complexe, 
comportant 20 expns et" 19 introns. Cinq departs de 
transcription ont ete cartographies, dont un est 
utilise preferentiellement . Un fragment presentant une 
activite promotrice a ete identifie. Ce promoteur 
permet une expression constitutive particulierement 
forte lors de la germination des graines et de la 
maturation des grains de pollen ; 

- de mettre en evidence l 1 existence d'un clone 
putatif dont l 1 initiation de transcription se 
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situerait en amont de la TATA box identifiee. Ce gene 
pourrait done coder pour les deux formes proteiques, 
son expression etant eventuellement dirigee par deux 
promoteurs ; 

- d'emettre l'hypothese que la fontte 
mitochondriale de l'aconitase se differencie de la 
forme cytosolique essentiellement par la presence, a 
l'extremite NH 2 , d'un peptide signal mitochondriale. 

- de caracteriser le gene de l'aconitase chez le 
mais et ainsi, de faire une comparaison entre 
l'aconitase de plantes dicotyledones et celle de 
plantes monocotyledones. La proteine est extremement 
conservee (90% d'homologie) entre les deux types de 
plantes, et presente des regions specif iques aux 
plantes, et d'autres conservees, parmi toutes les 
especes etudiees, y compris les animaux et les micro- 
organismes. Au niveau du gene, 1 1 organisation 
genomique est identique chez les monocotyledones et 
chez les dicotyledones. 

L'objet de la presente invention est une proteine 
ayant une activite enzymatique d'aconitase. Plus 
particulierement l» invention concerne une proteine 
ayant une activite enzymatique d'aconitase 
caracterisee en ce qu'elle comporte, soit 

i) la sequence en acides amines illustree dans la 
figure 1 ou une sequence presentant au mo ins 75 % 
d'homologie avec celle-ci, soit : 

ii) une variante de la sequence i) comportant une 
deletion jusqu'a 40 acides amines environ au niveau de 
1 1 extremite NH 2 • 

Dans le contexte de la presente invention, une 
activite enzymatique d'aconitase est definie comme 
etant la capacite de catalyser la reaction 
d ' isomerisation du citrate en iso-citrate via le cis- 
aconitate. Cette activite peut etre dosee par la 
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methode decrite par Rose et O'Connel (J. Biol. Chem. , 
242 : 1870-1879, 1967), Cette methode fait appel au 
couplage de plusieurs reactions enzymatiques decrites 
ci-dessous : 

Aconitase 

Citrate > Isocitrate 

< 

Isocitrate dehydrogenase 
Isocitrate > a-cetoglutarate 

- — ' "^4. 

NADP NADPH2 

La reduction du NADP est suivie par spectrophotometrie 
a 340nm. 

Une autre methode de dosage d 1 activite 
enzymatique de l 1 aconitase est celle decrite par 
Kennedy et al. (J. Biol. Chem., 258 : 11098-11105, 
1983) qui permet de suivre a 240 nm 1 'apparition du 
cis-aconitate a partir de 1 1 isocitrate. La reaction 
enzymatique se deroule a 25° C dans un tampon 
phosphate 50mM a pH 6 avec isocitrate 50mM comme 
substrat. Le coefficient d 1 extinction molaire du cis- 
aconitate est donne comme etant egal a 3,6mM" 1 , une 
unite enzymatique (U) correspondant a la formation 
d'une micro-mole de cis-aconitate par minute. Ce 
dosage, facile a mettre en oeuvre, est utilise pour 
determiner les constantes enzymatiques de l 1 aconitase 
et pour suivre sa purification. 

La proteine de 1» invention, outre son activite 
d' aconitase, peut egalement presenter une activite 
d ' IRE-BP, c 1 est-a-dire, est capable de se fixer a des 
ARNm ayant une structure secondaire voisine de celle 
de 1 1 iron-responsive element (IRE) animal. 

La proteine de 1' invention, ayant une activite 
enzymatique d 1 aconitase, peut etre celle dont la 
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sequence en acides amines est illustree dans la figure 
1, et qui represente l'aconitase d [ Arabidopsis 
thaliana . 

L' invention englobe egalement des proteines 
presentant au moins 75 % d'homologie avec la sequence 
illustree dans la figure 1 et ayant une activite 
d'aconitase. Dans le contexte de la presente 
invention, le pourcentage d'homologie entre deux 
sequences d* acides amines est calcule comme etant le 
nombre d 1 acides amines identiques plus le nombre 
d' acides amines similaires dans l'alignement des deux 
sequences, divise par la longueur des sequences entre 
deux positions donnees. Si, entre les deux positions 
donnees, les deux sequences n'ont pas la meme 
longueur, le pourcentage d'homologie est le nombre 
d' acides amines identiques et similaires, divise par 
la longueur de la sequence la plus longue. Les acides 
amines "similaires" sont connus dans l'art, voir par 
exemple R. F. Feng, M.S. Jobson and R.F. Doolittle, 
1985, J. Mol. Evol., 21 : 112-115. lis sont 
normalement consideres comme etant ceux qui, au sein 
d«une ma trice de permutation, ont un coefficient de 
substitution positif . 

De preference, les proteines homologues de 
1* invent ion presentent au moins 80, et plus 
particulierement au moins 85, par exemple 90 ou 95 % 
d^omologie, et de preference au moins 80% par exemple 
85% ou 90% d' identity avec celle illustree dans la 
figure 1. 

Comme proteines preferees de 1' invention, on peut 
aussi citer les deux aconitases de melon purif iees 
par les inventeurs a partir de graines de melon. Les 
deux formes semblent avoir en commun une meme sequence 
en acides amines. La sequence partielle en acides 
amines est illustree dans la figure 2. Elle presente 
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86,5 % d'identite avec celle d 1 Arabidopsis thaliana 
(91,8 % d 'homologie) . Les deux formes d'aconitase de 
melon purifiees par les inventeurs, selon la methode 
decrite dans les exemples plus loin, ont un poids 
moleculaire apparent estime en gel de polyacrylamide 
en conditions denaturantes voisin de 97KDa. Les points 
isoelectriques de ces deux proteines (appelees "Acol" 
et "AcoII") sont estimes respect ivement a 5,2 et 5.0. 

Comme autre exemple de proteine preferee de 
1' invention, on peut citer l'aconitase de mais 
(figures 18 et 20) 

Les proteines presentant au mo ins 75 % 
d 1 homologie avec celle de la figure 1 comprennent 
aussi l'aconitase d 1 autres especes vegetales, en 
particulier les Angiospermes. On peut citer en 
particulier l'aconitase des dicotyledones comprenant 
les legumineuses, les cruciferes, les solanacees, les 
cucurbitacees , les chenopodiacees , les ombelliferes, 
le tournesol, le soja. Les cucurbitacees et les 
especes du genre Brassica, par exemple B . napus 9 B. 
oleracea etc.. sont particulierement preferees. On 
peut aussi citer l'aconitase des monocotyledones 
comprenant les cereales telles que le ble, le mais, 
l'orge, le triticale et le riz. 

Les proteines de 1 1 invention peuvent egalement 
etre def inies comme etant des proteines ou des 
enchainements proteiques comportant au moins I'une des 
sequences proteiques suivantes, ou une sequence 
presentant au moins 60%, et de preference au moins 70% 
ou 80% d'homologie avec l'une de ces sequences, ces 
sequences etant specifiques aux aconitases vegetales : 

I : DTVSMIEAYIJIANKMFVDYSEPESKTVYSSCLELNLEDVE 

II : PLKEMKADWHS CLDNRV 
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III : AVPKEAQSKAVEFNFNGTTAQLR 

IV : KGMTMSPPG 

V : AWMMRLWREHFANIRIVNKHLKGEVG 

VI : NVS E I KPGQ DVTWTNN 

VII : les acides amines 1 a 40 de l'extremite NH 2 
de la proteine illustree dans la figure 1. 

Ces sequences se trouvent aux positions suivantes 
de l'aconitase d 1 Arabidopsis thaliana illustree dans 
la figure 2 : 

I : 361-400 

II : 414-4 3 0 

III : 436-458 

IV : 683-691 

V : 745-771 

VI : 875-891 

Outre les regions specif iques aux plantes, les 
proteines de l 1 invention renferment egalement 
plusieurs zones hautement conserves au sein de toutes 
les especes etudiees. Ces zones seront appelees dans 
ce qui suit "regions conservees du point de vue 
phylogenetique". II s'agit de sequences d 1 acides 
amines ayant une longueur d'au moins 7 acides amines 
et etant conservees avec au moins 75% d'homologie 
(environ 60% d'identite), et souvent au moins 80% 
d f homologie f chez les plantes, les animaux et les 
micro-organismes. Comme exemple de ce type de region , 
on peut citer les sequences suivantes (les numeros 
entre parentheses etant les acides amines d'A. 
thaliana , numerotes selon la figure 2) : 

VIII : PGSGIVHQVNLE (acides amines 204 a 216), 



IX : GTDSHTTMIDGLG (acides amines 23 6 a 248) 
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X : DSITTDHISPAG (acides amines 406 a 417) 

XI : GSGSSRD (acides amines 808 a 814) 

L' invention englobe egalement des variantes de la 

# sequence illustree dans la figure 1 et de celles 

presentant au moins 75 % d'homologie avec celle-ci, 
les variantes comportant une deletion de jusqu'a 40 
acides amines environ au niveau de 1' extremite NH 2 . 
Cette deletion n'affecte pas l'activite enzymatique 
d'aconitase de la proteine. Du point de vue 
physiologique, cette deletion correspond soit a 
1 'elimination du peptide signal mitochondrial soit a 
1 •elimination de la partie de la sequence qui 
differencie la forme mitochondriale de la forme 
cytosolique. De preference, la deletion s'etend de 
I'acide amine 1 a I'acide amine 30 environ. 

Pour Arabidops is thai iana , la deletion au niveau 
de l 1 extremite NH 2 s'etend de preference de I'acide 
amine 1 a I'acide amine 27 (numerotation selon la 
figure 1) ou encore de I'acide amine 1 a I'acide amine 
29. En effet, les inventeurs demontrent que la forme 
mitochondriale de l'aconitase d ' Arabidopsis thai iana 
demarre a I'acide amine 28 (Ser Ser Met...). Ceci 
signifie que les acides amines 1 a 27 correspondent 
vraisemblablement au peptide signal mitochondrial. La 
forme cytosolique de l'aconitase d 'Arabidopsis 
thai iana demarre vraisemblablement a l'acide amine 3 0 
(Met) . 

Dans ce qui suit, les proteines ayant une 
activite d'aconitase et comportant la sequence de la 
figure 1, ou une sequence presentant au moins 70 % ou 
75% d'homologie avec celle-ci, ou encore les variantes 

* comportant une deletion NH 2 -terminale, seront appelees 

"les proteines de 1 • invention" . 
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L' invention concerne egalement des fragments 
proteiques, ou des "enchainements d'acides amines", 
comprenant au moins 6 acides amines de la proteine de 
l 1 invention, et de preference au moins 8 ou au moins 
10 acides amines. La longueur maximale des fragments 
de 1 1 invention correspond a la longueur de la proteine 
entiere moins un acide amine. Typiquement, les 
fragments de 1 ■ invention ont une longueur comprise 
entre 10 et 900 acides amines, par exemple entre 2 0 et 
8 00, ou entre 3 0 et 500 acides amines, notamment 50, 
200, 300, 400, etc... acides amines. Les fragments 
proteiques de longueur importante, par exemple au-dela 
de 500 acides amines, peuvent eventuellement presenter 
une activite enzymatique d"aconitase. Les fragments 
peuvent done etre des peptides, des polypeptides ou 
des proteines. Ces fragments proteiques peuvent etre 
reconnus par des anticorps capables de reconnaitre la 
proteine entiere, les fragments presentant done une 
homologie immunologique avec la proteine "mere" . 

Selon une variante de 1" invention, les fragments 
ont une longueur comprise entre 6 et 40 acides amines 
et presentent, sur toute leur longueur, une homologie 
d'au moins 90%, et de preference au moins 90% 
d'identite, avec la partie correspondante de la 
proteine de la figure 1. L' expression "la partie 
correspondante" signifie la partie de la proteine 
illustree dans la figure 1 avec laquelle l'alignement 
est fait pour calculer 1' homologie. Ces fragments ont 
typiquement une longueur comprise ente 8 et 3 0 acides 
amines . 

Exceptionnellement, les fragments de 1' invention 
peuvent avoir une longueur infer ieure a 40 acides 
amines et ne presenter que 60% d 1 homologie avec la 
partie correspondante de la proteine de la figure 1. 
Ceci est le cas lorsqu'il s'agit de fragments 
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correspondant aux regions de la proteine specifiques 
aux plantes. Dans le contexte de 1' invention, 
" specif ique aux plantes" signifie une sequence 
d 1 acides amines ayant une longueur d'au moins 6 et de 
preference au moins 8 acides amines, presentant moins 
de 40%, et souvent moins de 30% d'homologie avec les 
sequences correspondantes chez les mammi feres et chez 
les organismes unicellulaires. Au sein du regne 
vegetal, ces regions sont conservees avec une 
homologie d'au moins 60%, typiquement au moins 80%. 
Les regions specifiques aux aconitases vegetales 
comprennent les sequences suivantes : 

I : DTVSMIEAYLRANKMFVDYSEPESKTVYSSCLELNLEDVE 

II : PLKEMKADWHSCLDNRV 

III : AVPKEAQSKAVEFNFNGTTAQLR 

IV : KGMTMSPPG 

V : AWMMRLWREHFANIRIVNKHLKGEVG 

VI : NVSEIKPGQDVTWTNN 

dont les emplacements ont ete indiques plus haut. 

Selon ce dernier mode de realisation, le fragment 
peut etre constitue d'un fragment de 1' extremite NH 2 
de la proteine illustree dans la figure 1, 
l 1 expression "extremite NH 2 " , signifiant la partie de 
la proteine s'etendant de l'acide amine 1 a I'acide 
amine 40, par exemple entre 1 et 30. Le fragment peut 
egalement etre constitue d'un sous-fragment d'une 
sequence ayant une longueur de 4 0 acides amines 
environ et presentant au moins 60 % d'homologie avec 
I 1 extremite NH 2 de la proteine illustree dans la 
figure 1. Le fragment NH 2 -terminal a normalement une 
longueur comprise entre 6 et 4 0 acides amines, par 
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exeinple 30. De preference, ces fragments presentent au 
moins 70 %, et plus particulierement au moins 80 % 
d 'homologie, avec les acides amines 1 a 40 de celle 
illustree dans la figure 1. L'extremite NH 2 correspond 
vraisemblablement au peptide signal mitochondrial 
responsable du transport de I'aconitase dans les 
mitochondries. Les fragments selon cet aspect de 
1 ' invention constituent done des peptides signaux et 
peuvent etre utilises, par exemple dans la production 
de proteines de fusion pour assurer le transport dans 
les mitochondries. 

Selon une autre variante de l f invention, les 
fragments proteiques ont une longueur super ieure a 40 
acides amines, par exemple 40 a 100, et presentent sur 
toute leur longueur au moins 75%, et de preference au 
moins 80 ou 90% d 1 homologie avec la partie 
correspondante de la proteine de la figure 1. Comme 
exemples de ce type de fragment, on peut citer la 
moitie NH 2 terminale de la proteine, la moitie COOH 
terminale ou encore la partie centrale. 

Les enchainements d' acides nucleiques de 
l 1 invention peuvent comprendre, outre le fragment 
derive de I'aconitase vegetale decrite ci-dessus, 
d'autres regions ne presentant aucune relation avec 
I'aconitase. Cette variante englobe des proteines de 
fusion et d'autres proteines "hybrides". 

Les proteines et fragments proteiques de 
1 ■ invention peuvent etre obtenus par purification a 
partir de la plante, en mettant en oeuvre le protocole 
experimental decrit dans les exemples ci-dessous, 
suivi eventuellement par un clivage de la proteine 
pour obtenir des fragments. lis peuvent egalement etre 
produits par voie recombinante apres 1 ' insertion dans 
un hote cellullaire competent d'une sequence d'acide 
nucleique appropriee suivie de la purification de la 
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proteine ainsi produite. lis peuvent egalement etre 
obtenus par synthese chimique. 

Outre les proteines et fragments proteiques, 
1 1 invention concerne egalement les genes de 
l'aconitase vegetale, "et toutes les sequences d'acide 
nucleique derivees de la sequence genomique, toutes 
les sequences codantes y compris les sequences 
degenerees, les sequences regulatrices , les introns, 
les sequences susceptibles de s f hybrider avec le gene 
de 1 1 aconitase vegetale et des fragments de ces 
sequences . 

Plus particulierement, !• invention concerne une 
sequence d'acide nucleique caracterisee en ce qu'elle 
comport e so it : 

i) une sequence qui, le cas echeant apres 
transcription, epissage et traduction, donne lieu a la 
proteine de l 1 invention, soit 

ii) le transcrit de la sequence i) ou son 
equivalent ADNc, soit 

iii) une sequence complement a ire de la sequence 
i) ou ii) , soit 

iv) une sequence ayant une longueur d'au moins 25 
bases et capable de s'hybrider, sur toute sa longueur, 
avec les sequences i) , ii) ou iii) dans des 
conditions stringentes ou moyennement stringentes, 
soit 

v) un fragment consistant en au moins 6, et de 
preference au moins 25 ou 30, nucleotides consecutives 
de l'une quelconque des sequences i) , ii) , ou iii). 

Le terme acide nucleique signifie dans le cadre 
de la presente invention de I'ADN ou de l'ARN, ou 
eventuellement un melange des deux. 

Selon cet aspect de l 1 invention, une sequence 
d'acides nucleiques du type i) est la sequence 
genomique d f Arabidopsis thaliana illustree dans la 
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figure 1 ou celle du mais illustree dans la figure 18. 
On peut aussi citer les sequences genomiques vegetales 
du gene de l'aconitase chez d'autres especes, par 
exemple les monocotyledones, telles que les cereales 
etc..., et dicotyledones, par exemple de nombreux 
legumes. Ces sequences peuvent etre identifiees par 
1 "utilisation d'une reaction d 1 amplification decide 
nucleique, de preference Reverse-Transcriptase 
Polymerase Chain Reaction (RT-PCR) , les amorces et les 
conditions etant, par exemple, celles utilisees dans 
1' exemple 11 plus loin, le substrat etant de l'ARN 
poly A+. On peut egalement utiliser d'autres amorces 
derivees du gene de l'aconitase vegetale, par exemple 
les sequences codant pour tout ou partie des 
enchainements d'acides amines I a XI cites ci-dessus. 

Les sequences genomiques peuvent egalement etre 
identifiees chez des especes autres que celles 
specif iquement exemplifiees dans cette demande par 
1 'utilisation d'une sonde specif ique au gene de 
l'aconitase vegetale, par exemple une sonde contenant 
les sequences I a VI citees ci-dessus. Les conditions 
d' hybridisation sont celles citees dans 1' exemple 6. 

Comme exemple de sequences d'acide nucleique du 
type ii) , on peut citer les transcrits (mRNA) du gene 
de l'aconitase vegetale, ou son equivalent en ADNc, 
par exemple les ADNc illustres dans les figures 3 et 
4, ainsi que toutes les sequences degenerees capables 
de coder pour la proteine de la revendication 1. Les 
sequences du type ii) englobent egalement le transcrit 
primaire (pre-mRNA) c'est-a-dire le transcrit de l'ADN 
genomique avant epissage. Le pre-mRNA contient 
notamment les introns . 

L' invention englobe egalement les sequences du 
type iii) , c'est-a-dire les sequences complementaires 
des sequences i) et ii) . L' expression "complementaire" 
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signifie normalement une complementarity de 100 %, 
mais peut egalement signifier un degre de 
complementarite suffisamment eleve pour permettre 
1 'hybridation stable entre la sequence et sa sequence 
complementaire dans des conditions stringentes. La 
presence d'un certain nombre de mesapariements, par 
exemple jusqu'a 10 %, ou eventuellement jusqu'a 2 0 %, 
peut etre toleree. 

L 1 invention concerne egalement des sequences du 
type iv) , c'est-a-dire des sequences d'acides 
nucleiques ayant au moins 25 bases et etant capables 
de s'hybrider avec les sequences i) , ii) et iii) 
telles que definies ci-dessus, dans des conditions 
stringentes ou moyennement stringentes. De preference, 
ces sequences ont une longueur entre 25 et 1000 bases, 
par exemple 30 a 900 ou 50 a 500. 

Les conditions stringentes sont les suivantes : 

- 1 'hybridation s'effectue sur les filtres de 
nitro-cellulose dans 20ml de solution d 1 hybridation 
(SSC 6X, SDS 5%, DENHARDT 5X, ADN de spermes de saumon 
50mg/ml) . 

- une pre-hybridation de 4 heures est suivie 
d'une hybridation de 12 heures (solution contenant la 
sonde marquee) a la temperature de 68 °C. 

Les filtres subissent les lavages suivants : 

- 2 lavages de 30 mn dans une solution SSC 2X a 
68 °C ; 

- un lavage de 30 mn dans une solution SSC 2X f 
SDS 0.1% a 68°C ; 

- un lavage de 30 mn dans une solution SSC 0.1X f 
SDS 0.1% a 68°C. 

Les conditions de moyenne stringence (a appliquer 
par exemple lors du criblage d'une banque provenant 
d'une espece vegetale avec une sonde provenant d'une 
autre espece vegetale) sont les suivantes : 
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- les conditions d 1 hybridation se font en faisant 
varier la concentration de formamide 10, 20, 30, 40, 
50 % a une temperature fixe de 40 °C dans un tampon 
d" hybridation SSC 6X, SDS 0.1%, DENHARDT 5X, ADN de 
spermes de saumon 50mg/ml. 

- une pre-hybridation de 4 heures est suivie 
d'une hybridation de 12 heures. 

Les conditions de lavage sont les suivantes : 

- un lavage de 3 0 mn dans une solution SSC 2X a 
42°C ; 

- un lavage de 3 0 mn dans une solution SSC IX a 
42°C ; 

- un lavage de 30 mn dans une solution SSC 0.1X a 
42°C ; 

- un lavage de 3 0 mn dans une solution SSC 0.1X, 
SDS 0.1% a 68°C. 

Ces conditions de stringence permettent 
d' identifier les sequences codant pour 1'aconitase 
chez une espece vegetale par le criblage d'une banque 
d 1 ADNc de cette espece avec une sonde provenant d'une 
autre espece vegetale. 

En general, les conditions stringentes permettent 
1 1 hybridation de deux sequences d'acide nucleique 
presentant au moins 85%-90% d'homologie. Les 
conditions moyennement stringentes permettent 
1 'hybridation de sequences presentant au moins 60% ou 
au moins 65% d'homologie. Dans le contexte de 
1' invention, "homologie" au niveau de l'acide 
nucleique signif ie identite. 

L* invention vise egalement des sequences du type 
(v) , c'est-a-dire des fragments d'acide nucleique 
consistant en au moins 6, et de preference au moins 
20, 25 ou 30, par exemple 40, 50, 60 ou plus 
nucleotides consecutives de l'une quelconque des 
sequences (i) , (ii) , ou (iii) precedemment decrites. 
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Avantageusement, le fragment comporte entre 10 et 500 
nucleotides, par exemple entre 3 0 et 300. 

Le fragment peut etre capable de jouer le role 
d'amor<?e dans une reaction d •amplification decide 
nucleique. Dans ce cas, un couple de fragments est 
utilise, chaque sequence ayant une longueur de 15 a 
3 00 bases environ, de preference entre 18 et 50 bases, 
Les fragments choisis comme amorces doivent 
avantageusement correspondre a des zones de la 
proteine separees les unes des autres par moins de 900 
acides amines, de preference moins de 500, par exemple 
une cinquantaine d 1 acides amines. 

Le fragment derive du gene de I'aconitase peut 
faire partie d'une sequence "hybride" plus grande, 
comportant d'une part au moins un fragment selon 
!• invention et d 1 autre part, une ou plusieurs 
sequences ne presentant pas d'apparente avec le gene 
de l^conitase, par exemple une sequence derivee d'un 
deuxieme gene. 

Le fragment peut etre marque par des moyens 
connus en soi, par exemple des moyens radioactifs, 
f luorescents, enzymatiques, ou par un marquage a 
l'avidine ou a la biotine. Selon cet aspect de 
1' invention, le fragment marque sert de sonde 
nucleotidique. Dans ce cas, la longueur du fragment 
est de preference comprise entre 6 et 9 00 bases, par 
exemple entre 50 et 350 bases. 

Selon une variante preferee de l 1 invention, la 
sequence d'acide nucleique est une sequence dite 
"complementaire" qui comporte un ou plusieurs 
fragments ayant une longueur d'au moins 6 nucleotides, 
par exemple au moins 10 nucleotides, le(s)dit(s) 
fragment (s) etant complementaire (s) d'une partie, au 
moins, du transcrit du gene de 1 1 aconitase. Ce genre 
de structure, capable d"inhiber !• expression du gene 
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de I'aconitase, englobe plus particulierement des 
sequences antisens et des ribozymes diriges centre le 
transcrit du gene de I'aconitase. 

Dans le cas de -1 « ant i sens, la sequence comporte 
normalement un seul fragment, complementaire d'une 
partie au moins, du transcrit, ce fragment ayant une 
longueur d'au moins une vingtaine de nucleotides. 
Plusieurs sequences antisens peuvent etre reliees les 
unes aux autres soit de maniere contigvie, soit en 
alternance avec d- autres sequences. 

De preference, la sequence inhibitrice est un 
ribozyme dirige centre le transcrit du gene de 
I'aconitase, le ribozyme comprenant une sequence 
complementaire d'une partie au moins du transcrit : du 
gene de I'aconitase et, incluse au sein de cette 
sequence complementaire, une region catalytxque 
provenant d'un ribozyme, de preference un ribozyme du 
type tete de marteau (voir par exemple EP-A-321 201) . 
Le ribozyme peut etre un mono-ribozyme ou un poly- 

ribozyme. . 

selon 1- invention, les sequences antxsens et les 
ribozymes sent normalement produits inzyiyo par la 
transcription de la sequence d'ADN correspondante , 
inseree de maniere stable dans le genome de la plants. 
La traduction du transcrit du gene de I'aconitase est 
alors empechee, soit par 1 'hybridation de la sequence 
antisens, soit par le clivage du transcrit par le 
ribozyme, affectant ainsi le f onctionnement du cycle 
de Krebs et du cycle glyoxylate, ainsi que la ou les 
voie(s) metabolique(s) regulee(s) post- 

transcriptionnellement par I'aconitase cytosolique 
arace a son activite RNA-binding. L' inhibition de la 
production d'aconitase conduit a une reduction du taux 
de production des acides organiques de ces deux 
cycles, mais a une augmentation de la production de 
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1' acetyl coenzyme-A. Ce dernier est le produit de la 
degradation des squelettes carbones de plusieurs voies 
du catabolisme, par exemple la glycolyse, le cycle des 
pentoses, la 0-oxydation des lipides et le catabolisme 
des proteines. La degradation de ces substances peut 
etre done indirectement modifiee par l 1 inhibition de 
l 1 expression de l'aconitase. 

La mise en oeuvre et les applications de la 
sequence inhibitrice est decrite en detail plus loin. 

Selon un mode de realisation preferee de 
l 1 invention, le fragment d'acide nucleique est un 
fragment de la sequence genomique du gene de 
l'aconitase vegetale, par exemple celle illustree dans 
la figure 1 ou celle illustree dans la figure 18. Le 
fragment genomique comporte au moins 25 nucleotides et 
de preference au moins 30, par exemple entre 50 et 500 
ou plus, sauf s'il s'agit d'une partie d'une region 
non codante ou d'un intron de la sequence genomique, 
auquel cas, le fragment peut avoir une longueur d»au 
moins 10 nucleotides. 

Les introns du gene de l'aconitase vegetale 
constituent des fragments preferes de l 1 invention. II 
a ete constate que 1 1 organisation genomique du gene de 
1 1 aconitase est identique chez Arabidopsis 
(dicotyledone) et chez le mais (monocotyledone) , les 
introns se positionnant exactement de la meme maniere. 

Chez les monocotyledones et chez les 
dicotyledones, le gene de l'aconitase contient un 
nombre d' introns particulierement eleve : environ 19 a 
20. L'aconitase represente done une source d' introns 
tres riche. Par ailleurs, l'epissage des introns doit 
etre particulierement efficace dans la mesure ou le 
gene est exprime de maniere constitutive. 

L 1 invention englobe done les introns des genes 
d 1 aconitase vegetale, y compris les signaux 
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d'epissage, et des fragments des introns comprenant au 
moins 10, et de preference au moins 3 0 bases. En 
general, la longueur des introns varie entre 70 et 500 
bases environ. Selon cette variante, les sequences 
comprenant le ou les introns peuvent egalement 
comprendre les sequences qui, dans le genome, jouxtent 
immediatement l 1 intron. Le fragment peut alors 
comprendre de part et d' autre de 1' intron, une 
sequence correspondant a une partie de 1 1 exon qui 
naturellement jouxte l'intron, cette sequence ayant de 
preference une longueur comprise entre 1 et 100 bases, 
par exemple 5 a 50. 

Comme exemple d f introns de 1' invent ion, on peut 
citer ceux d 1 Arabidopsis et de mais (voir tableau III, 
exemple 12 ) . On peut egalement citer les introns 
d'autres especes, les sequences genomiques pouvant 
etre identifiees de la maniere indiquee dans 1* exemple 
12. 

Les introns du gene de l'aconitase vegetale 
peuvent etre utilises comme elements susceptibles 
d'augmenter l'efficacite d' expression d'une sequence 
heterologue chez une plante. En effet, il a ete 
demontre, particulierement chez les monocotyledones 
que 1" insert ion d'un intron dans la partie 5'non 
traduite d'un gene, c'est-a-dire entre le site 
d' initiation de transcription et le site d 1 initiation 
de traduction, conduit a une amelioration de la 
stabilite du messager, et par consequent, a une 
meilleure expression. Le ou les introns utilises de 
cette maniere proviennent de preference d'une 
monocotyledone telle que le mais. II s'agit de 
preference, mais pas obligatoirement, du premier 
intron du gene. Le premier intron du gene de 
1 ' aconitase de mais peut etre obtenu par sequengage de 
la partie du gene qui se trouve en amont de la 
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sequence genomique partielle de la figure 18 contenue 
dans le clone Rl (voir exemple 12) . Le sequengage 
complet du fragment Sall-Hindlll de 6800 pb (Hindlll = 
position 2841) devrait permettre l'obtention du 
premier intron et du promoteur (voir exemple 12) . 

Comme autre exemple de fragment d'acide nucleique 
non-codant, on peut citer le fragment -85 a +1, par 
exemple -85 a -52, de la sequence de la figure 1. II a 
ete constate que cette region presente une structure 
secondaire typique des IRE (Iron Responsive Element) . 
II se pourrait que cette partie de la sequence soit 
specif ique du messager de l'aconitase mitochondriale, 
auquel cas un ribozyme dirige specif iquement contre 
cette region, ou une partie, par exemple la region -49 
a +1, permettrait d'inhiber specif iquement l'activite 
mitochondriale . 

Un autre fragment particulierement prefere est le 
fragment Hindlll - Bglll (-1293 a +45 de la sequence 
genomique de la figure 1) , ou le fragment 
correspondant dans des sequences codant pour des 
proteines homologues. Le promoteur du gene de 
l'aconitase se trouve au sein de ce fragment. Ce 
fragment peut etre utilise en tant que tel comme 
promoteur pour obtenir !• expression de sequences 
codantes heterologues chez les plantes. 

Des fragments de plus petite taille peuvent 
egalement etre utilises a condition que l'activite 
promotrice soit conservee. Ces "sous -fragments" 
peuvent etre identifies par la fusion du sous-fragment 
en question avec la sequence codante d'un gene 
rapporteur tel que celui du beta glucuronidase, et la 
detection de 1' expression du gene rapporteur dans des 
cellules vegetales. La deletion, au sein du fragment 
Hind III - Bgl II, de 100 a 300 nucleotides du cote 
5 1 donne lieu normalement a des sous-fragments ayant 
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une activite promotrice. II est preferable de 
preserver la phase de lecture pour tester le fragment 
choisi. 

II est egalement possible, selon 1' invention, 
d'utiliser deux regions promotrices en tandem pour 
augmenter le niveau d 1 expression. 

Le promoteur conduit a une expression 
constitutive et est fortement exprime a la fois lors 
de la germination des graines et lors de la maturation 
de la graine et des grains de pollen. II est done 
particulierement avantageux d'utiliser la region 
promotrice de l 1 invention pour obtenir une forte 
expression pendant cette periode de la vie de la 
plante. Les tissus de la graine, oil 1' expression 
dirigee par le promoteur est particulierement forte, 
sont les cotyledons, 1« albumen ou 1 1 endo-sperme , et 
1 1 embry on . 

Le fragment promoteur est de preference utilise 
pour diriger une expression constitutive, soit dans le 
cytoplasme, soit dans les mitochondries, soit dans les 
deux a la fois. Pour obtenir 1' expression d'une 
proteine heterologue dans les mitochondries, la 
sequence codant pour le peptide signal mitochondrial 
de I'aconitase est fusionnee a l^extremite 5 1 de la 
sequence codante. 

II peut egalement etre envisage d'utiliser des 
fragments promoteurs s'etendant plus en amont du site 
Hindlll (-1293). Les inventeurs ont identifie un 
clone par la technique RACE dont l'extremite 5' sur la 
sequence genomique se situe en position -52 en amont 
de la premiere TATA box. Ceci laisse suggerer qu'une 
initiation de la transcription peut avoir lieu plus en 
amont. Ces resultats indiquent 1" existence eventuelle 
d'un deuxieme promoteur qui pourrait etre responsable 
de la transcription de l'une des deux formes de 
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l'aconitase a partir du gene. Ce deuxieme promoteur 
fait egalement partie de l 1 invention. 

Le promoteur du gene de l'aconitase de mals fait 
egalement partie de l 1 invention. II est compris dans 
la partie amont de la sequence genomigue de la figure 
18, notamment au sein du fragment Sall-Hindlll cite 
dans l 1 exemple 12. 

Les regions promotrices de 1 1 invention sont 
normalement utilisees sous forme de gene chimerique. 
Ces genes chimeriques comportent : 

i) une region promotrice selon 1' invention, et 

ii) une sequence heterologue transcrite, codante 
ou non, placee sous le controle dudit promoteur. 

L ? expression "sequence heteroloque transcrite, 
codante ou non" signifie dans le contexte de la 
presente invention toute sequence transcrite autre que 
celles normalement associees avec le promoteur de 
l'aconitase dans la plante. Cette expression englobe 
des sequences non-codantes telles que des ribozymes ou 
des sequences antisens, dirigees contre un transcrit 
d'interet, ainsi que des sequences codantes. 

Comme exemples de sequences codantes, on peut 
citer : 

- des genes rapporteurs tel que Gus codant pour 
le Beta glucuronidase ; 

- des sequences conferant une resistance a un 
antibiotique, par exemple la resistance a la 
kanamycine, la gentamycine, le G418, etc... ; 

- toutes sequences codantes conferant des traits 
interessants du point de vue agronomique, par exemple 
des sequences impliquees dans la sterilite male, par 
exemple des genes mitochondriaux non-edites, des 
sequences conferant une resistance a un virus ou aux 
herbicides etc. ; 
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- des sequences codantes de gene de mammi feres , 
par exemple 1 1 interferon, 1' hormone de croissance, 
I'insuline et tout autre produit susceptible d'etre 
utile en tant que medicament. 

Ces genes chimeriques permettent d'obtenir une 
forte expression dans les graines seches. 

L 1 invention concerne egalement des genes 
chimeriques capable d'etre exprimes chez les plantes 
caracterises en ce qu'ils comportent : 

i) un promoteur fonctionnel chez les plantes 
autre que celui naturellement associe avec le gene de 
l'aconitase, et 

ii) une sequence codant pour la proteine de 
1' invention, telle que definie ci-dessus, ou pour un 
fragment proteique, tel que defini ci-dessus. 

Comme exemples de promoteur dans ce type de gene 
chimerique, on peut citer le promoteur du 35S, le 
promoteur NOS, des promoteurs semences specif iques de 
la plante. 

Comme promoteurs specif iques de graines, on peut 
citer le promoteur du gene de la napin (EP-A-0255378) , 
ainsi que les promoteurs des genes AT2S d 1 Arabidopsis 
thaliana , c 1 est-a-dire les promoteurs PAT2S1, PAT2S2 , 
PAT2S3 et PAT2S4 (Krebbers et al., 1988, Plant 
Physiol., 87 : 859-866. 

La sequence codante correspond a celle codant 
pour la proteine de 1 • invention presentant une 
activite d'aconitase ou pour un fragment proteique 
presentant soit une homologie immunologique avec 
l'aconitase ou une activite d'aconitase. 

L' invention concerne en outre des genes 
chimeriques capable d'etre exprimes chez les plantes 
caracterises en ce qu'ils comportent : 

i) un promoteur fonctionnel chez les plantes, 
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ii) une sequence transcrite, codante ou non, 
placee sous le controle dudit promoteur, 

iii) un ou plusieurs introns du gene de 
l'aconitase vegetale, tel(s) que defini(s) ci-dessus. 

La presence d'un ou plusieurs introns stabilise 
l'ARNm transcrit. Le ou les intron(s) peuvent etre 
positionne (s) au sein de la sequence transcrite, ou 
peuvent etre place (s) entre le promoteur et le debut 
de la sequence transcrite, comme indique ci-dessus. 

L f invention vise egalement des plasmides ou 
vecteurs caracterises en ce qu'ils contiennent au 
moins l'une des sequences d'acide nucleique selon 
1' invention. De preference, les plasmides et vecteurs 
permettent la transformation stable de la plante, par 
exemple les plasmides Ti d ' Aqrobacter ium , des vecteurs 
viraux tels que les Geminivirus ou le CaMV. 

L' invention concerne egalement des cellules 
vegetales et des plantes transgeniques transformees de 
maniere stable par une sequence d'acide nucleique 
selon l 1 invention. Comme exemple de plantes 
transgeniques, on peut citer les especes appartenant 
aux families botaniques telles que les legumineuses 
(par exemple les haricots, pois, etc.), les 
cruciferes (par exemple, les choux, radis, etc.), 
les solanacees (par exemple les tomates, pommes de 
terre, etc..) les cucurbitacees (par exemple le 
melon) , les chenopodiacees (par exemple la betterave 
potagere) , et les ombelliferes (par exemple, les 
carottes, celeris, etc...). Les cucurbitacees et les 
Brassicae sont particulierement preferes. On peut 
egalement citer les cereales telles que le ble, le 
mais, l'orge, le triticale et le riz, et les 
oleagineux tels que le tournesol, le soja et le colza. 

Tous les moyens connus pour introduire de l'ADN 
etranger dans des plantes peuvent etre utilises, par 
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exemple Aqrobacter ium , electroporation, fusion de 
protoplastes, bombardement avec canon a particules, ou 
penetration d'ADN dans des cellules comme le pollen, 
la microspore, la graine et l'embryon immature, 
vecteurs viraux tels que les Geminivirus ou les virus 
satellites. Aqrobacterium tumefaciens et rhizoqenes 
constituent le moyen prefere. Dans ce cas, la sequence 
de 1 1 invention est introduite dans un vecteur 
approprie avec toutes les sequences regulatrices 
necessaires telles que promoteurs, terminateurs , 
etc... ainsi que toute sequence necessaire pour 
select ionner les transf ormants. 

L 1 invention vise egalement des anticorps 
monoclonaux ou polyclonaux capable de reconnaitre, de 
preference de maniere specifique, la proteine et les 
fragments proteiques de l 1 invention. Ces anticorps 
sont produits selon les techniques habituelles dans 
l'art en utilisant, comme immunogene, la proteine 
purifiee selon les techniques decrites dans les 
exemples ci-dessous ou la proteine recombinante . La 
technique de purification de l'exemple 1 ci-dessous 
conduit a la production de deux formes de 1 1 aconitase 
(appelees Acol et AcoII) . En utilisant l'une de ces 
deux proteines comme immunogene, il est possible, 
selon l 1 invention, de produire des anticorps 
monoclonaux capable de faire la distinction entre les 
deux formes. Ces anticorps monoclonaux specif iques 
constituent des sondes immunologiques utiles pour 
etudier la localisation subcellulaire des deux formes 
enzymatiques, ou pour la purification. 

De maniere generale, les anticorps de l 1 invention 
peuvent etre utilises pour le crible de banques d 1 ADNc 
ou pour d'autres utilisations telles que 1 ! etude de la 
parente entre les aconitases de differentes especes. 
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Les proteines et acides nucleiques de 1 1 invention 
trouvent de nombreuses applications. Selon un mode de 
realisation particulierement prefere, les sequences 
decide nucleique et les genes chimeriques de 
l f invention sont utilises dans un procede pour la 
modification du metabolisme d'une plante. Ce procede 
est caracterise par 1 ■ introduction, dans la plante, 
d'un insert genetique comportant une sequence d'acide 
nucleique de l 1 invention. 

La modification du metabolisme de la plante peut 
consister, par exemple : 

- en la modification de la quantite d'aconitase 
produite par la plante ; 

- en une modification de l 1 expression temporelle 
ou spatiale de l'acitonase ; 

- en une modification de la nature de l'aconitase 
produite. 

De preference, la modification consiste en une 
modification de la quantite d'aconitase produite par 
la plante. II peut s'agir d'une augmentation ou d'une 
inhibition de la production d'aconitase. 

Une augmentation est obtenue par 1 1 introduction 
dans la plante d'un insert genetique comprenant un 
promoteur fonctionnel chez les plantes, et sous le 
controle de ce promoteur, une sequence codant pour la 
proteine de 1' invention. Le promoteur peut etre celui 
naturellement associe avec le gene de l'aconitase 
vegetale ou un promoteur heterologue au gene de 
l'aconitase. Lorsque le promoteur est le prpmoteur 
naturel, 1 • insertion de la sequence codante avec son 
propre promoteur conduit a une surproduction 
d ' aconitase , 1 ' expression des copies supplementaires 
du gene de l'aconitase etant spatialement et 
tempore llement identique au gene endogene. En 
revanche, si le promoteur est heterologue au gene de 
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l'aconitase, il peut s'agir d'un promoteur constitutif 
ou encore d'un promoteur specif ique de certains tissus 
ou de certains stades de developpement . Ceci permettra 
d' obtenir une expression temporelle et spatiale 
differente de celle produite par le gene endogene. 

La sequence codante utilisee pour obtenir une 
surproduction d'aconitase peut etre la sequence 
codante entiere exemplifiee par celle illustree dans 
la figure 1 ou peut correspondre a l'une des deux 
formes (mitochondriale ou cytosolique) permettant 
d 1 obtenir la surproduction dans une localisation 
subcellulaire definie. Les sequences codant pour les 
proteines presentant au moins 75 % d'homologie avec 
celle de la figure 1 peuvent egalement etre utilisees. 

Selon cet aspect de 1' invent ion, la surproduction 
d'aconitase conduit a une surproduction d'au moins 
1'un des acides organiques du cycle de Krebs ou du 
cycle glyoxylate, notamment le citrate, 1 ' isocitrate, 
le succinate, le glyoxylate, le malate, 
1 1 oxaloacetate , 1 ' a-cetoglutarate , le f umarate . 

Cette variante de 1 1 invention constitue done un 
procede pour obtenir une surproduction d' acides 
organiques chez les plantes. Les acides ainsi obtenus 
peuvent ensuite etre extraits de la plante f en faisant 
appel a des methodes connues en soi, pour 
1 'utilisation dans 1 ' industrie agroalimentaire, par 
exemple en tant qu'addifif, antioxydants etc. La 
production de citrate est particulierement preferee, 
par exemple en tant qu'additif pour des jus de fruits. 

La quantite d'aconitase produite par la plante 
peut egalement etre diminuee par 1 'utilisation d'un 
ribozyme ou d'une sequence antisens dirige contre au 
moins une partie du transcrit du gene de l'aconitase. 
Les ribozymes et les sequences antisens ont la 
structure decrite plus haut. Ces sequences 



WO 95/20046 



PCT7EP95/00263 



31 

inhibitrices peuvent etre utilisees dans un gene 
chimerique selon l 1 invent ion, le promoteur etant 
choisi afin de pennettre une expression appropriee. 
Par exemple, un promoteur inductible pennettrait la 
production du ribozyme et par consequent 
1 1 inactivation du transcrit de l^conitase uniquement 
lorsque les conditions d 1 induction etaient remplies. 
Le ribozyme ou la sequence antisens peut egalement 
etre sous le controle du promoteur de l 1 invention. 

Selon cette variante de 1" invention, 1' inhibit ion 
de la production d'aconitase conduit a une diminution 
de la production des acides organiques du cycle de 
Krebs et du cycle glyoxylate. Par consequent, il y a 
augmentation de la quant itie d 1 Acetyl coenzyme-A et 
d'acide citrique disponibles. L' Acetyl coenzyme-A 
etant le produit du catabolisme lipidique, proteique 
et polysaccharidique, il s'ensuit une modification du 
catabolisme de ces substances ou de certaines de ces 
substances. Cet aspect de 1" invention peut done etre 
applique par exemple a la reorientation du metabolisme 
ou du catabolisme d'amidon, d f huiles, de proteines, 
etc f pour les industries agro-alimentaires, chimiques, 
pharmaceutiques et cosmetologiques . 

Selon une autre variante de l 1 invention, la 
distribution tissulaire de l'aconitase peut etre 
modifiee. Par exemple, l f insertion de copies 
supplementaires de l'une des deux formes d»aconitase f 
par exemple la forme mitochondriale plutot que 1 1 autre 
forme, conduit a la surproduction de cette forme. 

En outre, le clivage systematique du peptide 
signal mitochondrial, par 1 utilisation d'un ribozyme 
telle que definie ci-dessus, conduit a la production 
de la forme cytosolique seulement de l»enzyme. 

Bien entendu, 1 1 utilisation d'un promoteur 
specif ique de certains tissus permettra l'obtention 
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d'aconitase dans les tissus oix 1 'expression n'est pas 
normalement tres forte. 

II peut egalement etre envisage de modifier la 
nature de l'aconitase produite par une plante par 
1' insertion, dans une plante appartenent a une 
premiere espece, d f une sequence codant pour 
l'aconitase d'une deuxieme espece. Ceci peut etre 
interessant lorsque la deuxieme espece presente des 
caracteristiques particulierement avantageuses , par 
exemple lorsque l'aconitase d'une espece particuliere 
est moins sensible a certaines substances, ou lorsque 
son expression est reglee differemment de celle de la 
plante hote. 

La modification du metabolisme de la plante par 
une augmentation ou une diminution de la production 
d'aconitase peut egalement influer sur le metabolisme 
des ions metalliques, tels que le fer, le cadmium et 
le cuivre. Ces effets sont vraisemblablement exerces 
grace au role d' IRE-BP que peut jouer l'aconitase 
vegetale. 

Differents aspects de 1» invention sont illustres 
dans les figures : 

- Figure 1 : sequence nucleotidique du gene 
codant pour une proteine a activite aconitase chez 
Arabidopsis thaliana . 

Legende : lettres minuscules = sequence non 
codante, lettres majuscules = sequence codante, acides 
amines en caracteres gras = sequence montrant une 
homologie avec les sequences proteiques NH 2 terminales 
de l'aconitase mitochondriale de pomme de terre et des 
aconitases (Acol et AcoII) de graines de melon. 

- Figure 2 : comparaison des sequences proteiques 
des aconitases de differentes especes. Les sequences 
proteiques des IRE-BP et des aconitases de E. coli . de 
pore et des levures ont ete extraites de la banque 
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"Swiss Prot 26" (version Aout 93). L 1 al ignement a ete 
realise avec le programme PC Gene Clustal (Intelli 
Genetics) • 

Legende : ARABACO = Aconitase d ' Arabidopsis 
thaliana , MELONACO = Aconitase de melon ( Cucumis 
melo) , IREB = Iron Responsive Element Binding Protein, 
ACON = Aconitase, V = cysteines constituant le centre 
Fer-Soufre, 4 = acides amines formant le site actif, * 
acides amines identigues, . = acides amines 
similaires. 

- Figure 3 : sequence nucleotidique et proteique 
du clone d 1 ADNc n 6 l d'Arabidopsis thaliana codant 
pour une proteine a activite aconitase. 

Legende : lettres minuscules = sequence non 
codante, lettres majuscules = sequence codante, acides 
amines en caracteres gras = sequence montrant une 
homologie avec les sequences proteiques NH 2 terminales 
de 1 1 aconitase mitochondrial de pomme de terre et des 
aconitases (Acol et AcoII) des graines de melon. 

- Figure 4 : sequence nucleotidique et proteique 
du clone d 1 ADNc n° 16 de melon codant pour une 
proteine a activite aconitase. 

Legende : lettres minuscules = sequence non 
codante, lettres majuscules = sequence codante 

- Figure 5 : cycle de Krebs 

- Figure 6 : cycle du Glyoxylate 

- Figure 7 : cycle de Krebs = source de 
squelettes carbones utilises dans plusieurs voies de 
biosynthese. 

Figure 8 : compartimentation des enzymes 
impliquees dans le cycle du Glyoxylate. 

1 : citrate synthase, 2 : isocitrate lyase, 3 : 
malate synthase, 4 : malate dehydrogenase. 

- Figure 9 : schema du principe de la RACE-PCR. 
Legende : am et am 1 = amorces complementaires. 
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- Figure 10 : carte de restriction deduite du 
clone ADNc n° 1 d 1 Arabidopsis thaliana codant pour une 
proteine a activite aconitase. 

B : bamHI, E : EcoRI, H : Hindlll, RV : Eco RV, 
Pv : PvuII. 

Figure 11 A : sequence nucleotidique et 
proteique de l'extremite 5 f du cDNA n° 1 d 'Arabidopsis 
thaliana codant pour une aconitase. 

Caracteres gras : sequence proteique montrant de 
l'homologie avec les extremites NH 2 terminales des 
aconitases de pomme de terre et de melon. 

- Figure 11 B : comparaison des sequences NH 2 
terminales de I'aconitase deduite du cDNA 
d y Arabidopsis thaliana , de 1 1 aconitase de melon 
( Cucumis melo ) , et de I'aconitase mitochondrial de 
pomme de terre ( Solanum tuberosum ) . 

- Figure 12 : pourcentages d •homologies entre les 
aconitases de differentes especes. 

Legende : ARABACO = Aconitase d 'Arabidopsis 
thaliana , MELONACO = Aconitase de melon ( Cucumis 
melon ) , IREB = Iron Responsive Element Binding 
Protein, ACON = Aconitase, le chiffre gras = 
pourcentage de residus identiques, le chiffre entre 
parentheses = pourcentage de residus similaires. 

- Figure 13 : arbre phylogenique des aconitases 
de differentes especes. 

Legende : ARABACO = Aconitase d 'Arabidopsis 
thaliana , MELONACO = Aconitase de melon ( Cucumis 
melo) , IREB = Iron Responsive Element Binding Protein, 
ACON = Aconitase. 

- Figure 14 : cartographie physique du gene de 
I'aconitase d 'Arabidopsis thaliana . 

A : carte de restriction de la partie 5 1 du 
fragment genomique isole a partir de la banque DASH, 
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B : carte de restriction de la partie 3 1 du 
fragment genomique isole a partir de la banque EMBL, 

C : cartographie du gene de 1 1 aconitase deduite 
des deux cartes precedentes. 

B = BairiHI, Ps = PstI, Pv = PvuII, H = Hindlll, E 
= EcoRI, X = Xbal, DASH = vecteur phagique DASH, EMBL 
= vecteur phagique EMBL3 . 

Figure 15 : structure IRE-like putative 
(position -85 a -52 sur la sequence genomique) . 

- Figure 16 : detail de la fusion traductionnelle 
du promoteur de 1' aconitase avec le gene rapporteur de 
la ^-glucuronidase portee par le vecteur binaire pBIOS 
170. 

a) Sequence de la region en amont du codon 
d 1 initiation putatif (Met) de l 1 aconitase. 

b) Sequence de la region en amont du codon 
d 1 initiation de la ^-glucuronidase (vecteur pBI 
101.1) . 

c) Sequence de la fusion du promoteur de 
1' aconitase avec le gene de la ^-glucuronidase (tataa 
= Tata box) . 

Caracteres standards : sequence de 1» aconitase, 
caracteres en italique : sequence de pBI 101.1. 

- Figure 17 : alignement des sequences proteiques 
et nucleotidiques d' A. thaliana (acides amines 240 a 
269) avec la partie correspondante du mais. La 
sequence de mais a ete obtenue par P.C.R., utilisant 
comme amorces, oligo D III et oligo D IV. Une 
homologie nucleique de 77. 5% , et proteique de 87.5% 
etait detectee. La sequence d'une centaine de bases a 
ensuite servie de sonde sur de l'ADN genomique de mais 
et a permis 1 * identification du gene. 

- Figure 18 : 603 6 paires de bases de la sequence 
genomique d'un gene aconitase de mais obtenues par 
sequen?age du clone Rl. La sequence proteique a partir 
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d 1 exon 2 est egalement indiquee, bien que l'extremite 
5 f de l'exon 2 n ! a pu etre determine avec certitude. 
L'exon 1 et 1 1 intron 1 n'ont pas ete identifies, mais 
ils se situent dans les quatre mille premieres bases 
d'un fragment d'une taille de 6800 paires de bases 
Sall-Hindlll du clone genomique Rl ; Hindlll etant a 
la position 2841 de la sequence presentee. 

Figure 19 : alignement des aconitases 
Arabidopsis et mais attestant la tres grande 
conservation de ces enzymes. (* = acides amines 
identiques, . = acides amines similaires) . 

- Figure 20 : alignement entre 3 aconitases 
vegetales identifiees dans le cadre de la presente 
invention (ZMACO = Aconitase mais, ATACO = aconitase 
Arabidopsis , CMACO = aconitase melon, * = acides 
amines identiques, . * acides amines similaires) . 

- Figure 21 : amorces D I a D VI utilisees dans 
l'exemple 11. 

EXEMPLES 

EXEMPLE I : PURIFICATION DE 2 POLYPEPTIDES AYANT UNE 
ACTIVITE ACONITASE A PART I R DE GRAINES DE MELON : 

L 1 aconitase a ete purifiee a partir de graines de 
melon par des techniques chromatographiques 
traditionnelles . 

L'extrait brut est prepare par broyage de 100 g 
de graines au waring blendor (3 mn, 4°C, Vitesse 
maximale) , puis agite dans 100 ml de tampon Imidazole 
20 mM ; pH 7,5 (1 h, 4°C). La fraction soluble 
contenant l'activite est recuperee apres 
centrifugation (13 000 g, 30 mn, 4°C), puis filtree 
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sur une feuille de miracloth permettant d'eliminer les 
debris cellulaires et une grande partie des lipides. 

La premiere etape chromatographique consiste en 
une chromatographie d'echange d'ions sur une resine Q 
sepharose fast flow" (PHARMACIA) . La suspension 
proteique brute (1 360 mg) est deposee au sommet de la 
colonne equilibree avec un tampon d 1 Imidazole 20 mM, 
pH 7,5. Les proteines sont eluees en conditions 
isocratiques dans un tampon Imidazole 20 mM, ph7,5 
additionne d 1 acetate de sodium 200 mM. 

Les fractions actives (2 60 mg de proteines) sont 
dessalees sur des colonnes EconoPac 10 DG (BIORAD) 
avec un tampon Imidazole 2 0 mM, pH 7,5. Les proteines 
sont alors deposees sur une colonne contenant une 
resine d»affinite sur colorant Yellow 86 (SIGMA). 
L»elution est ensuite realisee par un gradient 
lineaire d f acetate de sodium allant de 0 a 0,5 M dans 
un tampon Imidazole 20 mM, pH 7,5. 

Les fractions actives sont de nouveau recuperees 
(14,4 mg de proteines) puis ajustees a une 
concentration en sulfate d» ammonium de 1,2 M. 

Les extraits proteiques sont alors deposes sur 
une colonne d 1 interactions hydrophobes Protein Pack 
HIC Phenyl 5 PW (WATERS) . L'elution des proteines est 
ensuite effectuee par un gradient lineaire de sulfate 
d 1 ammonium allant de 1,2 a 0 M dans un tampon 
Imidazole 20 mM, pH 7,5. 

Deux pics d f activite sont alors detectes. Le 
premier pic d'activite (Aco I) est elue pour une 
concentration en sulfate d' ammonium voisin de 0,9 M. 
Le deuxieme pic d'activite (Aco II) est elue pour une 
concentration plus faible de 0,7 M. 

Les fractions actives sont de nouveau dessalees 
(fraction Aco I : 0,76 mg ; fraction Aco II : 0,44 mg) 
dans un tampon Imidazole 20 mM, pH 7,5. Enfin, les 
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fractions actives de chacun des pics d 1 activite sont 
deposees sur une colonne d'echange d'ions Mono Q MR 
5/5 (PHARMACIA) . 

Cette derniere chromatographic permet d'obtenir 
deux proteines a activite aconitase relativement pures 
apres une elution avec un gradient lineaire d 1 acetate 
de sodium de 0 a 0.3 M dans un tampon d' Imidazole 
20 mM, pH 7,5. Les proteines Aco I et Aco II etaient 
eluees pour une concentration en acetate de sodium 
voisine de 2 00 mM. Les proteines Aco I et Aco II en 
fin de purification ont ete purifiees d'un facteur 
respectivement de 878 fois et 763 fois. Ces deux 
proteines montrent des activites specifiques voisines 
de 1 518,42 mmol/mn/mg pour Aco I et de 1 321,15 
mmol/mn/mg pour Aco II. 

90 mg de proteine pure Aco I et 60 fxg d f Aco I 
sont obtenus en fin de purification. 



Tableau I : 



E tapes de 
purification 


Proteines 
(mg) 


Activite 

totale 
(nmol/min) 


Activite 
specif i que 
< nmol/min/ 
mg) 


Activite 
restante 
(X) 


Facteur 

de 
Purifi- 
cation 


Ext rait brut 


1360 


2360 


1.73 


100 




Sepharose QFF 


266 


1565 


5.88 


66.3 


3.4 


Yellow 86 


14.4 


725 


50.34 


30.7 


29.2 


Phenyl HIC 

- fraction Aco I 

- fraction Aco II 


0.76 
0.44 


229 
54 


781.78 
122.48 


9.7 
2.3 


451.9 
70.8 


Mono Q 

- fraction Aco I 

- fraction Aco II 


0.09 
0.06 


137 
79 


1518.42 
1321.15 


5.8 
3.3 


877.7 
763.7 
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EXEMPLE 2 : DETERMINATION DE LA SEQUENCE NH2 TERMINALE 
DES 2 ACONITASES : 

Un gel de polyacrylamide (gel de separation 10 
% ; gel de concentration 5 %) est coule 24 h avant son 
utilisation (systeme Mini Protean II BIORAD) . Une 
pre-electrophorese de 1 h 30 a 20 mA permet 
d ' homogeneiser le gel. 

Les echantillons ne doivent pas etre denatures, 
ils sont places 15 mn a 3 7°C. La separation se fait 
pendant 45 mn a 190 V. 

Apres la separation, les proteines sont 
transferees sur une membrane PVDF (Poly Vinyl 
DiFluoride) . La membrane est plongee 10 s dans une 
solution de methanol 100 % puis incubee dans le tampon 
de transfert CAPS (3 [cyclohexylamino] t-propane 
sulfonic acid) 10 mM, pH 11, additionne de methanol 10 
% jusqu f a l'equilibre. 

L f electrotransfert des proteines se fait en 
condition semi-seche avec le systeme multiphor 2117 
LKB pendant 1 h a 60 mA (0 f 8 mA/cm2 de membrane). 

Les proteines transferees sur la membrane PVDF 
sont visualisees apres coloration au bleu de Coomassie 
R250 (solution a 0 f l % dans du methanol 50 %) pendant 
5 mn, puis decoloration 5 a 10 mn dans la solution 
suivante methanol, acide acetique, eau (5 : 10 : 40 
vol) . 

La partie de membrane correspondant a la 
proteine interessante est decoupee, et la proteine 
sequencee. 

La partie NH2 terminale de la proteine est 

sequencee selon la reaction de HEWICK et al (1981) 

avec le sequenceur automatique Applied-Biosystem. 

La sequence NH2 terminale des aconitases de 
graines de melon, que les inventeurs ont determinee, a 
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pu etre comparee (Figure 11) avec la sequence NH2 
terminale de I'aconitase mitochondriale de pomme de 
terre (COURTOIS-VERNIQUET et DOUCE , communication 
personnelle) . Une forte homologie entre ces sequences 
est constatee : sur 14 residus sequences, 9 sont 
communs avec I'aconitase mitochondriale de pomme de 
terre. Cela peut signifier que I'aconitase 
mitochondriale de melon a ete purifiee ou bien alors 
que les sequences NH2 terminales des aconitases 
mitochondriales et cytosoliques sont tres homologues. 
L' absence de methionine come premier acide amine 
pourrait indiquer une maturation de la proteine lors 
de 1 1 importation dans les mitochondries (clivage du 
peptide signal) • 

EXEMPLE 3 : FABRICATION D» ANTICORPS POLYCLONAUX 
DIRIGES CONTRE LES ACONITASES : 

Les lapins (hybrides femelles de 2 a 3 mois) sont 
immunises par voie intradermique avec 10 /xg 
d'aconitase purifiee, emulsionnee a un volume egal 
d 1 adjuvant de Freund complet lors de la premiere 
immunisation, incomplet pour les immunisations qui 
suivront (40 et 70 jours apres la premiere injection) . 

Les prelevements de sang, pratiques dans la veine 
centrale de l'oreille sont effectues regulierement 
(toutes les semaines) . Le sang recueilli sur heparine 
est rapidement centrifuge (3000 g, 4°C, 5 mn) . Les 
plasmas contenant les anticorps sont repartis en 
aliquots et conserves a -20 °C. 

La caracterisation des anticorps polyclonaux se 
fait par la technique de Western Blot selon le 
protocole detaille ci-dessous. 
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L 1 electrophorese des proteines ou des fractions 
purifiees est effectuee en gel denaturant SDS-PAGE 
10 % (gel de separation), gel de concentration 3 %. 

Les echantillons sont prepares dans le tampon 
suivant : Tris/HCl 10 mM ; pH 8,0 ; EDTA 1 mM ; SDS 
2,5 % ; £-mercaptoethanol 5,0 % ; bleu de bromophenol 
0,01 %. Les proteines sont denaturees par chauffage 
(100°C, 5 mn) . 

Un depot de 100 Ml d'extrait brut (preparation : 
voir exemple I) traite dans les conditions decrites 
ci-dessus en presence de 10 % de sucrose, est realise 
dans un puits unique. 

Les marqueurs proteiques colores de poids 
moleculaire ( Rainbow- AMERSHAM) sont les suivants : 
myosine (200 000) phosphorylase b (97 400), inhibiteur 
de trypsine (21 500), lysozymes (14 300). 
L 1 electrophorese s'effectue sous un courant de 20 mA 
par gel pendant 1 h. 

Les proteines separees sur gel SDS-PAGE sont 
transferees sur membrane de nitrocellulose. 
L'electrotransfert se fait avec l'appareil mini trans 
blot BIORAD ou le Phast System PHARMACIA ( trans fert 
semi-sec selon les recommandations du fabricant) , 
en fonction du type de gel qui a permis la separation 
prealable des proteines. 

La revelation de la membrane par les anticorps se 
fait comme suit : 

la membrane est incubee dans une solution 
saturante TBST (Tris-HCl 2 0 mM ; NaCl 500 mM ; 
Tween 20 0,05 %) additionnee de Regilait (5 %) pendant 
un minimum de 3 h. 

- puis la membrane est placee 2 h dans une 
solution d f incubation TBST contenant le premier 
anticorps (anticorps polyclonal dilue au 1/8000 ou 
anticorps monoclonal : surnageant de culture) . 
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- 1 •elimination de l'exces d 1 anticorps se fait 
par trois lavages successifs de 3 mn dans une solution 
TBST. La membrane est ensuite incubee 2 h dans une 
solution TBST, en presence d'un second anticorps 
conjugue a la phosphatase alcaline (anti- 
immunoglobulines de lapin diluees au 1/9 000 ou anti- 
immunoglobulines de souris diluees au 1/4 000, SIGMA) . 
Apres cette etape, 3 nouveaux lavages sont effectues. 

enfin, le complexe antigene-anticorps est 
revele dans la solution de developpement suivante : 5 
ml de tampon phosphatase alcaline (Tris/HCl 100 mM ; 
pH 9,5 ; NaCl 100 mM ; MgCl2 5 mM) , 33 fil de nitro 
blue tetrazolium (NBT) a 50 mg/ml prepare dans du 
dimethyl formamide 70 %, 16,5 /il de 5 Bromo-4-chloro-3 
indolylphosphate (BCIP) a 50 mg/ml prepare dans de la 
dimethyl formamide . 

Des anticorps polyclonaux ont ete produits apres 
immunisation de deux lapins avec la proteine Aco I 
(10 jug/ inject ion) et de deux autres lapins avec la 
proteine Aco II (10 jug/ inject ion ) . 

La reactivite et la specificite des anticorps 
sont testees sur des extraits bruts ou purifies de 
proteines de graines de melon separees par 
electrophorese et transferees sur une membrane de 
nitrocellulose. Les anticorps donnent une reponse 
forte pour une dilution jusqu'au 1/8 000. Les deux 
plasmas donnent le meme type de reponse. 

Dans l'extrait brut, une seule bande est reconnue 
a environ 97 kDa, demontrant la specificite des 
anticorps polyclonaux. De meme, dans les extraits 
proteiques des autres etapes chromatographigues , une 
seule bande est reconnue. Notons que les plasmas 
reconnaissent aussi bien Aco I que Aco II et ce, quel 
que soit le materiel ayant servi a 1 1 immunisation (Aco 
I ou Aco II) . 
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La forte specificite de ces anticorps permettra 
leur utilisation principalement pour le crible de 
bangues ADNc ou pour d'autres utilisations eventuelles 
(localisation cytologique de l'aconitase, parente 
entre les aconitases de dif ferentes especes) . 

EXEMPLE 4 ; ISOLEMENT D 1 ADNc ACONITASE PAR 
IMMUNOSCREENING D 1 UNE BANQUE D» EXPRESSION DE FRUIT 
MATURE DE MELON : 

Les inventeurs disposaient d'une banque ADNc de 
fruit de melon mur (Cantaloup charentais) . 

Les ADNc sont clones au debut du gene de la 0- 
galactosidase dans les phages UNI-ZAP. Un clonage 
oriente permet de reduire de moitie les clones qui ne 
sont pas dans la bonne phase de lecture. 

Le represseur lad q qui bloque la transcription 
du gene lac Z est apporte par la bacterie XL1 Blue. Ce 
represseur est important car il permet de controler 
l 1 expression des proteines de fusion qui peuvent etre 
toxiques pour E.coli. 

Ainsi, la production de proteines de fusion se 
fait au moment choisi grace a 1' addition de 1"IPTG 
(isopropylthio/3-D galactoside) qui est un inducteur du 
promoteur du gene lac Z. 

Les etalements de la banque se font comme decrit 
dans Sambrook et al (1989, Molecular Cloning : a 
Laborat ory Manual , Cold Spring Harbor Laboratory 
Press, New-York) . Au bout d 1 environ 8 h, lorsque les 
plages de lyse apparaissent , les filtres prealablement 
imbibes dans une solution d'IPTG 10 mM puis seches, 
sont deposes a la surface des boites. Les boites sont 
de nouveau incubees pendant 3 h a 37 °C permettant a 
l'IPTG d'induire la proteine de fusion qui se fixera 
sur le filtre apres que les bacteries aient ete 
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lysees. Ce sorrt les bacteries infectees formant le 
contour de la plage de lyse qui produiront la proteine 
de fusion. Ainsi, lors de la revelation par les 
anticorps, les plages de lyse apparaitront sous forme 
de halo. Les filtres sont perces en trois positions 
asymetriques pour pouvoir reperer facilement les 
plages positives. 

La revelation de la proteine de fusion se fait comme 
decrit dans l'exemple 3 a l'aide des anticorps 
polyclonaux produits. 

Les clones positifs sont reperes en superposant 
les filtres reveles avec la boite correspondante. Le 
morceau de gelose contenant la zone positive est 
preleve a l'aide d'une pipette pasteur, puis place 
dans 1 ml de tampon SM contenant une goutte de 
chloroforme (inhibant le developperoent bacterien) 
pendant 1 h a temperature ambiante pour permettre la 
diffusion des phages dans la solution. Les tubes sont 
conserves a 4°C. 

Apres le premier crible, les plages de lyse 
positives qui sont prelevees ne sont pas pures (plages 
confluentes) . II convient, pour isoler avec certitude 
un clone positif, d'effectuer plusieurs cribles 
successifs en reetalant les plages de lyse recuperees 
de fagon a obtenir des plages de lyse isolees. 

Sur les 4.10 5 phages qui ont ete etales, 28 
clones purs reconnus par les anticorps polyclonaux ont 
alors pu etre isoles. 

Ces clones ont ete analyses par digestion 
enzymatique, hybridation et sequengage. 

La digestion de ces clones par EcoRI et Xho I 
montre deux categories de clones : 

- Les clones dont 1' insertion contient un site de 
restriction EcoRI mais pas de site de restriction Xho 
I (21 clones) . 
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- Les clones dont 1 1 insertion contient un site de 
restriction Xho I mais pas de site de restriction 
EcoRI (7 clones) . 

Pour etudier la parente de ces clones les 
inventeurs ont realise des hybridations en dot-blot 
(ceci permet d'effectuer un tri preliminaire sans 
avoir a effectuer de digestion et de transfert sur 
membrane) . 

Le fragment obtenu, apres digestion par 1' enzyme 
de restriction EcoRI , du clone le plus grand (2,6 Kb) 
et du clone le plus court (2,3 Kb) de la premiere 
categorie ont servi de sonde. Les 21 clones de la 
premiere categorie sont apparentes : ils donnent un 
signal lors de 1 'hybridation. 

Apres digestion par EcoRI et transfert sur 
membrane, les clones sont hybrides avec le fragment 
EcoRI de 2 f 2 Kb du 10 donnent un signal, les 
inventeurs ont pu determine 3 classes de clones. La 
premiere classe (I) est constitute de 11 clones dont 
1' insert EcoRI a une taille de 1,7 Kb. La deuxieme 
classe (II) de clones (9 clones) comporte un insert 
EcoRI de 1,8 Kb. La 3eme classe (III) est constitute 
du clone le plus grand avec un insert EcoRI de 2,2 Kb 
(n°16) . 

EXEMPLE 5 : SEQUENCAGE DES ADNc DE MELON - HOMOLOGIES 
AVEC LES IRE-BP : 

La sequence complete du clone le plus long (n° 
16) a ete determinee par la technique classique de 
Sanger et al . Elle est presentee dans la figure 4. 

En 3 • , la sequence fait apparaitre une queue poly 
A de 80 residus. Un clone de chacune des classes I et 
II a ete sequence en 3 f et en 5' montrant une 
homologie parfaite avec le clone 16 mais avec des 
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queues poly A d'une longueur moins importante 
( respect ivement 21 et 27 residus) . D'apres toutes nos 
donnees d' analyses de restriction (simple et double 
digestion) , d 'hybridation et de sequengage, tous ces 
clones semblent provenir d'un meme messager. 

La sequence 5' du clone le plus long (n°16) n'a 
pas penriis de retrouver la sequence proteique 
correspondant a l'extremite NH2 terxninale. Ceci n'est 
pas etonnant car une proteine d' environ 100 kDa 
devrait etre codee par un ARNiq d'au moins 3 Kb. lis se 
sont alors servis de cette sequence de 900 pb pour 
interroger les banques de donnees (SWISSPROT - CITI 2) 
et s' assurer qu'ils avaient bien isole le clone ADNc 
correspondant a la proteine purifiee. Des homologies 
importantes ont ete retrouvees avec l f ensemble des 
sequences d'aconitase ou d' IRE-BP, en particulier avec 
1 1 IRE-BP humaine et l'aconitase d f E. coli (environ 
60 %) • 

Ces resultats suggeraient que l'ADNc 
correspondant a la proteine purifiee avait bien ete 
isole. Cependant, I'extremite 5 1 de cet ADNc n'etait 
pas presente. 

Avec des fragments 5 1 terminaux, les inventeurs 
ont essaye d^soler des clones complets dans cette 
banque, mais sans succes. Aussi ont-ils pris la 
decision de cribler une nouvelle banque d 1 ADNc qui 
provenait d'une autre espece vegetale. 
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EXEMPLE 6 : ISOLEMENT DE L'ADNc DE I^ACONITASE 
D' ARABIDOPSIS THALIANA ET COMPARAISON DES SEQUENCES 
PROTEIQUES DES ACONITASES DE DIFFERENTES ESPECES 
(ANIMALES , VEGETALES, BACTERIENNES) : 

Comme Arabidopsis thaliana est aujourd'hui 
1 'espece modele par excellence (petit genome, cycle de 
vie court, cartes genetiques et RFLP disponibles, 
etc...)/ il a ete choisi de cribler une banque ADNc de 
siliques immatures (ecotype Columbia) , construite par 
GIRAUDAT et al (1992, Isolation of the Arabidopsis 
ABI3 ge ne by Positional cloning, The Plant Cell 4 ; 
1251-1261) . Cette banque a ete realisee avec le 
vecteur Lambda ZAP II de STRATAGENE. Le clonage des 
ADNc n f est pas oriente (clonage EcoRI) . 

La difficulty dans ce choix de strategie est de 
trouver les bonnes conditions d 1 hybridation car les 
inventeurs disposent d'un clone ADNc servant de sonde 
d'une espece donnee (melon) pour cribler une banque 
d'une autre espece ( Arabidopsis thaliana ) . lis ne 
connaissent pas le degre de conservation de 
l'aconitase chez les plantes. Aussi f plusieurs 
conditions d 1 hybridation dans lesquelles la 
concentration en formamide variait (0 7 10, 20, 30, 40, 
50 %) ont ete testees. De meme, des conditions de 
lavages progressifs ont ete utilisees. 

Pour chaque condition d 1 hybridation, environ 
1,5.10 5 phages ont ete etales. La sonde utilisee est 
le fragment d'ADN de 2,2 Kb obtenu apres digestion par 
1' enzyme de restriction EcoRI du clone ADNc de melon 
n°16. 

7 clones hybridant avec la sonde dans les 
conditions suivantes ont ete isoles : hybridation 
effectuee en presence de 30 % de formamide a 42 °C et 2 
lavages dans une solution SSC 2X pendant 30 mn a 42 °c. 
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Ces clones ont ete analyses apres digestion par 
1' enzyme de restriction EcoRI. La carte de restriction 
sommaire des clones les plus longs, 3 clones de 
3,2 Kb, est decrite dans la figure 10. 

Les 4 autres clones sont identigues, leur taille 
est de 2,3 Kb. La carte de restriction montre qu'ils 
appartiennent a la meme classe gue les clones les plus 
longs, seul le fragment EcoRI de 0,8 Kb a 1 ■ extremite 
5 f est absent (ces clones proviennent 

vraisemblablement d'une methylation incomplete des 
sites EcoRI internes des ADNc) . 

Les 3 clones de 3,2 Kb (n° 1, 2, 3) ont ete 
sequences a chaque extremite (amorces universelles T3 
et M13) . A 1» extremite 3», il a ete observe une queue 
poly A constitute respectivement de 40, 15 et 16 
residus. La sequence de ^extremite 5 1 (Figure 11) a 
montre une forte homologie avec la sequence NH2 
terminale proteique de l'aconitase de melon (9 acides 
amines identiques sur 14) et de l"aconitase 
mitochondriale de pomme de terre (8 acides amines 
identiques sur 14) (figures 10 et 3). 

Un clone ADNc correspondant a 1 1 aconitase 
d 1 Arabidopsis thaliana avait done vraisemblablement 
ete isole. 

Les fragments EcoRI-EcoRV de 0,7 et 0,9 Kb (voir 
carte de restriction, Figure 10) ont ete sous clones 
dans le vecteur pBSII SK+ puis sequences aux 
extremites avec les amorces universelles T3 et M13 . Le 
clone ADNc en totalite a par la suite ete sequence 
(Figure 3) par la strategie de progression par 
oligonucleotides. Ce clone a une longueur totale de 
3 210 pb. Le cadre de lecture ouvert a une longueur de 
27 69 pb. Le codon de terminaison est un codon TAA 
(codon ochre), la partie non traduite en 3 1 a une 
longueur de 441 pb. A l 1 extremite 5 f , il n»y a pas de 
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codon stop (cadre de lecture ouvert) ce qui pourrait 
laisser supposer la presence d'un peptide signal. A 
1 1 exception de la methionine presente dans la sequence 
NH2 terminale proteique, il n'a pas ete observe 
d 1 autre methionine plus en amont, ce qui indiquerait 
que ce clone ne soit pas totalement complet. Le poids 
moleculaire de la proteine a activite aconitase code 
par cet ADNc deduit a partir de la sequence 
nucleotidique est de 98 490 Da. Le pi calcule est de 
6,0. Ces valeurs sont en accord avec les resultats 
obtenus lors de la purification (PM : 97 kDa ; pi : 
5,2) . 

Les essais d'obtention d'un clone plus long ont 
ete infructueux et la sequence totale du clone le plus 
long est presentee dans la figure 3 (ADNc n° 1) . 

La sequence des extremites 5 ' et 3 1 des ADNc 
n° 2, 3, 4 et 5 permettent leur positionnement sur la 
sequence du clone ADNc n° 1. 

L'extremite 5' des clones n° 2 et 3 se situe en 
position 66. Pour les clones 4 et 5 l'extremite 5 1 est 
en position 134. 

A l'extremite 3', les clones 2, 3, 4 et 5 se 
situent respect ivement en position 2964, 2964, 2926, 
2976. Les clones 2 et 3 sont strictement identiques ; 
meme depart et meme arret. L' analyse de la partie 3 1 
non codante du clone ADNc n° 1 fait apparaitre trois 
sites de polyadenylation possibles suivant le 
consensus AATAAA en position 2848, 2940 et 3026. Ces 
trois sites doivent etre fonctionnels car 3 positions 
d 1 arret compatibles ont ete obtenues pour les clones 
ADNc etudies. 

Les comparaisons de sequences de 1 ' IRE-BP humaine 
et de 1 1 aconitase mitochondriale de pore ( ROUAULT et 
al, 1991 (supra) ; HENTZE et ARGOS, (1991, Homology 
between IRE-BP, a regulatory RNA-bindinq Protein, 
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Aconitase, and isopropylmalae isomerase, Nucleic Acids 
Research 19 : 1739-1740) avaient montre la parente 
entre ces deux proteines (30 a 33 % d'identite). 

L'isolement des ADNc chez Cucumis melo et 
Arabidopsis thaliana codant pour une aconitase a 
permis de rechercher les homologies existant avec 
d'autres aconitases de differentes especes (Figure 2). 

Les alignements des sequences proteiques montrent 
des regions fortement conservees. Les etudes cristal- 
lographiques de LAUBLE et al (Crystal Structures of 
Aconitase with Isocitrate and Nitroisocitrate bound, 
Biochemistry 31 : 2735-2748) en 1992 avaient permis 
d 1 identifier 23 residus formant le site actif. Ces 
residus sont conserves dans toutes les aconitases 
etudiees. Ces alignements font egalement 

apparaitre que les proteines a activite aconitase 
etudiees chez Arabidopsis thaliana et Cucumis melo ont 
une homologie plus importante avec les IRE-BP. 

La Figure 12 indiquant les pourcentages 
d 1 homologie entre les differentes aconitases montre 
une homologie tres importante d' environ 90 % entre les 
aconitases vegetales etudiees. Ces proteines 
apparaissent plus proches des IRE-BP (homologie 
d 1 environ 70 %) et de l 1 aconitase de E. coli 
(homologie d 1 environ 65 %) que des aconitases 
mitochondrials (homologie d'environ 45 %) . 

L f arbre de distarice (Figure 13) permet de 
visual iser rapidement les parentes entre ces 
differentes aconitases . 

II a ete montre qu'il existe vraisemblablement 
chez les plantes une proteine a activite aconitase 
tres conservee. Ces proteines montrent une forte 
homologie avec les IRE-BP et devraient avoir un role 
dans des mecanismes de regulation traductionnelle. 
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EXEMPLE 7 : I SOLEMENT , SEQUENCAGE ET DETERMINATION DU 
DEPART DE TRANSCRIPTION DU GENE ACONITASE 
D' ARABIDOPSIS THALIANA : 

Jusqu'a present-, aucun gene codant pour 
l f aconitase mitochondrial ou pour l'aconitase 
cytosolique n'a ete etudie dans le domaine vegetal ou 
dans le domaine animal. 

Deux banques genomiques ont du etre criblees pour 
pouvoir isoler le gene complet de l'aconitase etudiee. 

Dans un premier temps une bangue LAMBDA DASH 
d ' Arabidopsis thaliana (ecotype C24) (ADN genomique 
digere partiellement par l 1 enzyme de restriction 
Hind III, puis clone dans le vecteur DASH au site Hind 
III) est criblee avec l'ADNc n°l de 3,2 Kb isole 
d' Arabidopsis thaliana . 

Parmi les 2.10 5 phages etales, 6 clones positifs 
ont ete isoles. Ces clones apparaissent identiques 
apres analyse par restriction. 

Les analyses par hybridation sur differentes 
digestions (simples ou doubles) par des enzymes de 
restriction a permis de montrer que ce clone 
recouvrait I'extremite 5 f du gene aconitase et etait 
incomplet en 3 1 ; 

Pour obtenir la partie manquante du gene en 3 • , 
les inventeurs ont du cribler une autre banque 
genomique . 

La banque genomique EMBL 3 d' Arabidopsis thaliana 
(ecotype Columbia) construite apres digestion 
partielle de 1 1 ADN par l 1 enzyme de restriction Mbo I 
puis clonage de ces fragments au site BamHI du vecteur 
EMBL 3. Apres etalement de 2.10 5 phages puis 
hybridation avec le fragment de 0,6 Kb, un clone 
repondant posit ivement a ete isole. Un fragment de 
restriction Hind III de 3,5 Kb hybridant faiblement 
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avec la sonde de 1,6 Kb et fortement avec la sonde de 
0,6 Kb a ete clone dans le vecteur pBS II SK+ puis 
sequence j usqu ' a ce que 1 1 on retrouve 1 1 extremite 3 1 
de l'ADNc. 

Les hybridations ont permis de completer la carte 
de restriction du gene codant pour une aconitase et de 
verifier la jonction Hind III entre les deux clones 
physiques (Figure 14) . 

Dans le meme temps, un Southern a ete realise 
pour tenter de voir s'il existe un ou plusieurs 
genes codant pour 1' aconitase, chez Arabidopsis 
thaliana , et pour verifier que la carte de restriction 
du gene etablie a partir des clones phagiques suit 
bien la carte genomique. 

L'ADN genomique de deux ecotypes d ' Arabidopsis 
thaliana (Columbia et C24) a ete digere par plusieurs 
enzymes de restriction. Les fragments obtenus ont ete 
separes sur un gel d' agarose 0,8 % puis -transferes sur 
une membrane de nylon Hybond N+. Cette membrane a ete 
hybridee avec les fragments EcoRI du clone ADNc n°l 
(0,8 ; 1,6 ; 0,6 Kb). La cartographie du locus de ce 
gene par Southern montre qu'elle suit exactement la 
carte de restriction obtenue avec les clones 
phagiques. 

Lors des cribles des banques genomiques, il a ete 
utilise deux ecotypes d ' Arabidopsis thaliana (Columbia 
et C24). Sur le Southern, il peut etre constate qu'il 
n 1 existe pas de polymorphisme entre C24 et Columbia, 
au locus etudie, pour les couples enzyme-sonde testes. 

L f analyse de ces resultats semble done indiquer 
qu'il n'existerait qu'un gene chez Arabidopsis 
thaliana codant pour l'ADNc isole. 

Les fragments d'ADN genomique suivants ont ete 
clones dans le vecteur pBS II SK+ avant sequen$age : 
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- BamHI - BamHI : environ 7,7 Kb ; 

- EcoRI - BamHI : environ 0,6 Kb ; 

- EcoRI - EcoRI : environ 2,8 Kb (dont un site 
EcoRI provenant du site de clonage du vecteur) ; 

- BamHI - BamHI : environ 2,0 Kb (dont un site 
BamHI provenant du site de clonage du vecteur) ; 

- BamHI - BamHI : environ 1,3 Kb ; 

- Hind III - Hind III : environ 5,5 Kb. 

La totalite du fragment Hind III - Hind III de 
5,5 Kb a ete sequencee. Chaque fragment clone a ete 
sequence aux deux extremites avec les amorces 
universelles T3 et M13. La strategie de progression 
par oligonucleotides a ete adoptee pour completer la 
sequence . 

II est a noter qu'il existe un site Hind III 
distant de 0,1 Kb du site Hind III de clonage. La 
presence de ce site a pu etre montree grace aux 
hybridations avec la sonde de 1,6 Kb (la double 
digestion BamHI-Hind III donne deux fragments de 1,8 
Kb et 1,3 Kb alors que la simple digestion BamHI donne 
un fragment de 2 Kb) . La presence de ce site a ete 
confirmee lors du sequen<?age des extremites des 
fragments EcoRI -EcoRI de 2,8 Kb et BamHI-BamHI de 
2,0 Kb. 

De plus, le fragment de restriction Hind III de 
3,5 kb de Lambda 3' EMBL a ete clone dans le vecteur 
pBS II SK+ puis sequence jusqu'a ce que l'extremite 34 
de l'ADNc so it retrouvee. 

Le gene de l'aconitase d' Arabidopsis thaliana a 
ete sequence sur une longueur de 6 762 pb (Figure 1) . 
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La comparaison de la sequence du gene de 
l'aconitase avec l'ADNc correspondant montre que le 
gene est const itue de 20 exons et de 19 introns. 

D'autres genes montrent egalement un grand nombre 
d' exons : le gene de la transferrine humaine est 
constitue de 17 exons, celui du recepteur de la 
transferrine de 19 exons. 

II est interessant de noter la presence du 
premier intron juste apres le codon d 1 initiation 
methionine putatif (position +91) . Ceci renforce 
1 1 idee que cette enzyme doit etre tres conservee : 
l'epissage devant etre parfait pour obtenir une 
proteine f onctionnelle. 

L 1 analyse de la partie 3 1 non codante montre 
trois sites de polyadenylation possibles suivant le 
consensus AATAAA. Ces trois sites sont situes en 
position 5068, 5199, 5285. II a ete constate lors de 
la caracterisation des ADNc (Exemple 5) que ces sites 
doivent etre fonctionnels. 

L'extremite 5' de l«ADNc codant pour l'aconitase 
a ete retrouvee sur la sequence genomique. Cependant, 
le site d» initiation de la transcription n 1 etait pas 
connu (la region amont du promoteur est riche en AT, 
il existe done plusieurs TATA box putatives) . Les 
resultats de Northern indiquent que le clone ADNc 
etait pratiquement complet (un signal d f hybridation 
etait visualise a environ 3,2 Kb, identique a la 
taille de l'ADNc). La presence d'un intron dans la 
region 5 1 du gene ne peut cependant pas etre exclue. 

Aussi, le site d' initiation de transcription a- 
t-il ete cartographie par la technique RACE avec le 
kit ampli finder RACE CLONTECH (Figure 9) . Pour cela, 
des ARN polyadenyles ont ete isoles a partir d'ARN 
totaux extraits de feuilles. L'integrite des ARN 
messagers est controlee en Northern en utilisant comme 
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sonde les fragments d'ADN obtenus par digestion EcoRI 
du clone ADNc n°l. 

L 1 oligonucleotide n° 19 : 

GCTGGAACTCAAGCTCCATGTTTGCCTGCA 

positionne en +524 sur la sequence de l'ADNc a servi a 
synthetiser le premier brin d 1 ADNc a partir des ARN 
polyadenyles purifies. 

A I'extremite 3 1 du brin d 1 ADNc nouvellement 
synthetise, un oligonucleotide (anchor) du kit 3 ! NH3 
GGAGACTTCCAAGGTCTTAGCTATCACTTAAGCAC 5 1 est accroche 
avec la T4 RNA ligase. L 1 amplification de I'extremite 
5 1 de l'ADNc se fait par PCR en utilisant un 
oligonucleotide complementaire de 1 'oligonucleotide 
"anchor" du kit et 1 'oligonucleotide n° 16 : 

CAAGCAAGATCAACAACAGCAGGAACACCA 

determine a partir de la sequence de 1 1 ADNc positionne 
en +375. La reaction PCR est effectuee dans les 
conditions suivantes : 

- Denaturation de 1 1 ADN 5 mn a 94 °C ; 

- 35 cycles d' amplification : 

- denaturation 1 mn a 94°C, 

- hybridation 1 mn a 50°C, 

- elongation 2 mn a 72 °C ; 

- Reaction finale d' elongation 7 mn a 72 °C. 

Apres amplification, aucune bande n f est 
visualisee sur gel d 1 agarose colore au bromure 
d'ethidium. 

II a alors ete realise une seconde amplification 
par PCR a partir de la reaction precedente en prenant 
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plusieurs couples d'amorces (1 1 oligonucleotide 
complementaire de 1 1 oligonucleotide "anchor" accroche 
au brin d 1 ADNc associe avec les oligonucleotides n°16, 
9 et 14 respectivement en position +375, +52, +230 
designes a partir de la sequence ADNc) . Les sequences 
des amorces 9 et 14 sont les suivantes : 

- n D 14 : CACAGTTACGTATGGCCGA 

- n° 9 : GTCGAGTGAAGAAGCAAA 

Les conditions d 1 amplification sont celles 
decrites precedemment . La solution de reaction de la 
premiere amplification est precipitee puis reprise 
dans 10 fil d'eau sterile. 2 jLtl de cette solution 
serviront de cible pour la deuxieme reaction 
d' amplification par PCR. Le temoin positif du kit 
attendu a environ 490 pb est visible piste 4. Une 
reamplif ication avec 1 •oligonucleotide n°16 donne de 
1 'aspecif icite (piste 2). L 1 oligonucleotide n°9 semble 
permettre 1 1 amplification d'une bande d'ADN a environ 
200 pb (piste 3). Avec 1 • oligonucleotide n°14, deux 
bandes ont ete amplifiees (piste 5) d'une taille 
d' environ 300 et 350 pb. Ces deux bandes ont ete 
donees dans un vecteur pGEM T sans avoir ete 
prealablement separees. 35 clones portant une 
insertion ont ete sequences. La selection des clones a 
ete realisee par digestion avec 1' enzyme de 
restriction Bgl II (site de coupure en position +48). 
Le +1 a ete positionne sur la sequence au site 
comptant le plus grand nombre de clones "cappes" (en 
1 1 occurrence 14 sur 35 clones sequences). Parmi ces 
35 clones, 14 s 1 arretent en position +1, 7 en position 
-2, 4 en position -4, 5 en position -9 et 1 en 
position +9. Tous ces clones, lors de la sequence 
montrent un G supplementaire en 5' qui n'est pas 
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present sur la sequence genomique. II s ! agit du 
capping (coiffe) du messager (indiquant ainsi avec 
certitude le site d' initiation de la transcription). 

Ainsi, ces resultats suggerent que le site 
d' initiation de transcription de ce gene est en fait 
constitue de plusieurs sites d 1 initiation (5 ont ete 
determines) s'etendant sur une zone de 19 pb (-9 a 
+9) . 

II a ete egalement observe un clone s'arretant en 
position +14, 3 en position +20 et 1 en position +29. 
Ces clones doivent provenir de 1' arret premature de la 
reverse transcriptase (aucun G supplement a ire en 5 1 de 
ces clones) . 

Un autre clone a ete sequence et place en 
position -49 sur la sequence genomique. Ce clone ne 
porte pas de G supplementaire ce qui indique qu'il 
n'est pas complet. La distance avec le premier site 
d 1 initiation est de 50 pb. Ce clone doit appartenir a 
une deuxieme classe de clone amplifiee lors de la PCR 
et formant la bande d'ADN sur gel d' agarose de plus 
grande taille. Ce type de resultat pourrait amener a 
penser qu 1 il existe un deuxieme promoteur plus en 
amont . 

II est a remarquer que les clones correspondant a 
la bande haute de 1 1 amplification ne sont pas clones 
avec la meme efficacite que ceux correspondant a la 
bande basse. 

Bien qu'il ne soit pas possible de conclure quant 
a la position d'une deuxieme site d f initiation de la 
transcription putatif, il est surprenant de trouver 
une struture secondaire ressemblant aux IRE (Iron 
Responsive Element) aux positions -85 et -52 (figure 
15) . 

Dans la partie 5 1 du gene, un site d' initiation 
de la transcription a ete cartographie avec precision. 
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En realite, 5 sites permettent le depart de la 
transcription dans la region -9 a +9, le site le plus 
usuel se situerait en +1. Une TATA box putative est 
situee en position -32 (TATAA) . Cette position est en 
accord avec les TATA box decrites qui se situent a 
32 ± 7 pb en amont du site d 1 initiation de la 
transcription. De multiples sites d 1 initiation de la 
transcription seraient presents plus particulierement 
pour les genes de menage. 

De ce site d 1 initiation de la transcription 
jusqu'au premier ATG (sans doute le codon 
d 1 initiation) en position +91, la sequence est 
codante, ce qui pourrait faire penser a la presence 
d'un peptide signal mitochondrial (le cadre de lecture 
reste ouvert jusqu'au codon TAA en position -30). 
Mais, dans cette sequence se trouvent un residu 
aspartique (en position 25) et un residu glutamique 
(en position 14) , les residus acides etant 
generalement absents dans les peptides signaux 
mitochondriaux. II n'existe cependant pas de sequence 
consensus stricte pour les peptides signaux de 
mitochondries . Aussi, il est possible que cette 
sequence constitue bien un signal d' importation dans 
les mitochondries . 

Une telle situation pourrait impliquer la 
presence d'un autre site d' initiation de la 
transcription plus en amont et done egalement la 
presence d'un deuxieme promoteur. 

Une autre situation permettant a un gene de coder 
pour deux proteines a localisations differentes est 
possible lorsque I'ARNm porte deux sites d f initiation 
de la traduction. De tels exemples ont ete decrits 
pour les genes de levure codant pour les enzymes de 
synthese des ARN de transfert de l'histidine et de la 
valine (NATSOULIS et al, (1986, The HTS1 Gene encodes 
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both the Cytoplasmic and Mitochondrial Histidine tRNA 
synthetases of S. cerevisiae, Cell 46 ; 235-243) 
CHATTON et al , (1988, The yeast VAS1 Gene encodes both 
Mitochondrial and Cytoplasmic Valyl-tRNA Synthetase, 
The Journal of Biological Chemistry 263 : 52-57) , Ces 
enzymes existent a la fois dans le cytoplasme et dans 
1 1 espace matriciel mitochondrial . Le premier site 
d 1 initiation de la traduction pennet la traduction 
d'une proteine avec le peptide signal d' importation 
dans les mitochondries . Le deuxieme site d 1 initiation 
de la traduction situe plus en aval donnera une 
proteine sans peptide d 1 importation mitochondriale et 
restera done a localisation cytoplasmique. Pour le 
gene de l'aconitase d 1 Arabidopsis thaliana , il 
n»existe apparemment pas un deuxieme site d f initiation 
de la traduction entre la methionine en position +91 
et le site d» initiation de la transcription (phase de 
lecture ouverte) . Cependant, la presence d'un codon 
d 1 initiation non conventionnel ne peut etre exclue. En 
effet f il semble que les codons ACG et AUA puissent 
jouer le role de codon d' initiation de la 
traduction. 

EXEMPLE 8 : EXPRESSION 8PATIO— TEMPORELLE DE L«ARN 
MESSAGER DE L'ACONITASE CHEZ ARABIDOPSIS THALIANA ET 
BRASSICA NAPUS : 

Les ARN totaux ont ete extraits de differentes 
parties des plantes etudiees. Apres separation sur un 
gel d» agarose denaturant 1,2 %, les ARN sont 
transferes sur une membrane de nylon puis hybrides 
avec les fragments EcoRI du clone ADNc n°l. 

Un signal plus ou moins intense est observe dans 
toutes les parties de la plante, indiquant une 
expression constitutive du gene de l f aconitase. 
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Un signal est egalement obtenu pour les ARN 
totaux du colza ( Brassica napus ) indiquant une forte 
conservation de 1 1 aconitase entre ces deux especes 
vegetales de la famille des cruciferes. Une forte 
expression de ce gene est detectee sur des jeunes 
plantules en germination. Or, il apparait que le cycle 
du glyoxylate doit etre tres eleve a ce moment du 
developpement permettant la transformation des lipides 
en sucres indispensables a la croissance de la plante. 
Ainsi, 1* aconitase etant une enzyme du cycle du 
glyoxylate, une forte expression de celle-ci a ce 
stade du developpement est en accord avec les besoins 
metaboliques de la plante. II est egalement possible 
que cette forte expression permette la production de 
squelettes carbones necessaires a plusieurs voies de 
biosynthese notamment lors de la synthese des acides 
amines. BROUQUISSE et al f 1987 ( supra) . avaient mis 
en evidence une forte activite aconitase cytosolique 
pouvant jouer cette fonction en association avec une 
activite isocitrate dehydrogenase NADP+ cytosolique, 
la formation d 1 equivalents reducteurs NADPH pouvant 
egalement etre utilisee dans des reactions de 
biosynthese. Une forte expression du gene de 
l 1 aconitase est egalement observee dans les fleurs 
ouvertes alors que les bourgeons en cours de 
developpement ne presentent qu'une faible expression. 
Pour preciser quel orgahe floral exprime fortement le 
gene de 1" aconitase, les inventeurs ont travaille sur 
le colza ( Arabidopsis thaliana etant une plante de 
petite taille, le prelevement des differents organes 
floraux est relativement delicat) . II a alors ete 
observe une forte expression du gene de l 1 aconitase 
dans les antheres comparativement a une faible 
expression dans les pistils. Cette forte activite dans 
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les antheres pourrait refleter un metabolisme tres 
actif pour la maturation des grains de pollen. 

De meme, une expression relativement importante 
est observee dans les siliques iitunatures. Cette 
expression pourrait permettre un stockage de l'ARN 
messager ou de la proteine a activite aconitase dans 
les graines qui seront utilises lors de la germination 
au moment de la reprise des metabolismes . Malgre le 
bruit de fond important (difficulty d' extraction des 
ARN de graines du fait d'une presence importante de 
lipides) un signal est egalement visible dans les 
graines seches. Enfin, une expression relativement 
faible dans les feuilles et dans les tiges est 
montree. 

L 1 ensemble de ces resultats semble indiquer une 
expression constitutive du gene codant pour une 
proteine a activite aconitase. Une forte expression 
lors de la germination peut faire penser a I 1 activite 
aconitase cytosolique intervenant dans le cycle du 
glyoxylate. II apparait toutefois que, lors de la mise 
en place de I'appareil photosynthetique, le cycle du 
glyoxylate est stoppe, les ARNm ne devant plus etre 
detectes dans les differents tissus de la plante. 

Cependant, I 1 expression observee du gene de 
1' aconitase dans les feuilles et les tiges pourrait 
etre due a 1' activite aconitase cytosolique permettant 
de produire des squelettes carbones pour differentes 
voies de biosynthese. 

Toutefois, si les aconitases cytosoliques et 
mitochondriales sont codees par le meme gene, il 
pourrait egalement s'agir du messager de la forme 
mitochondriale qui est exprime. 

II est interessant de noter que toute l 1 activite 
de la citrate synthase des graines de ricin est due a 
l 1 isoenzyme mitochondriale et que seul 1 1 ARN messager 



WO 95/20046 



PCT7EP95/00263 



62 

codant pour la forme mitochondrials serait presente 
dans les graines ( ZEHLER et SCHNARRENBERGER, (1984, 
Citrate Synthases from Germinating Castor Bean Seeds, 
I - Purification and properties, Physiolocria Plantarum 
60 ; 1-8) ) . Ces travaux ont ete possibles car les 
isoenzymes de la citrate synthase mitochondriale et 
glyoxysomale peuvent etre distinguees l'une de 1' autre 
(la citrate synthase glyoxysomale est inhibee par le 
5,5 1 dithiobis (2 nitrobenzoic acide) : DTNB) . Les 
deux formes isoenzymatiques montrent egalement des 
points isoelectriques differents respectivement de 5,9 
et 9,1 pour les formes mitochondriales et 
cytosoliques. 

Dans le cas de l»aconitase, la situation est plus 
complexe car non seulement les deux formes 
isoenzymatiques (cytosolique et mitochondriale) n'ont 
pas pu etre distinguees l'une de l 1 autre, mais de 
plus, la forme cytosolique intervient dans le cycle du 
glyoxylate. Celle-ci permet egalement de fournir des 
intermediaires du metabolisme acide, ces besoins 
pouvant etre permanents et non pas ponctuels comme le 
cycle du glyoxylate. 

Dans cette situation, il est difficile d'etudier 
l 1 expression de l'une ou l f autre des formes de 
l'aconitase car il est egalement possible, ainsi que 
les inventeurs en ont emis l'hypothese, qu'un seul 
gene code pour ces deux formes. 

Pour confirmer les donnees moleculaires obtenues 
sur 1 1 organisation de 1 1 extremite 5 1 du gene et sur 
l'expression spatio-temporelle de son ARNm, les 
inventeurs ont fait appel aux experiences de 
transgenese a 1 1 aide du gene rapporteur codant pour la 
^-glucuronidase (GUS) . Seule la partie 5 1 flanquante 
du gene a ete etudiee. 
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EXEMPLE 9 : CARACTERISATION D 1 UN FRAGMENT PROMOTEUR DU 
GENE ACONITA8E 

Au vu de la position du site d f initiation de 
la transcription (determinee par la technique 5 f 
RACE) , le site de restriction Bgl II (position +46) , 
apparait idealement place pour realiser une fusion 
transcriptionnelle avec le gene rapporteur GUS. En 
effet, il est situe en amont du codon de depart 
potentiel de l'aconitase cytoplasmique . Le fragment 
Hind III-Bgl II, d'une taille de 1339 pb a ete insere 
par un clonage oriente dans le vecteur binaire pBi 
101.1, sites Hind III - Bam HI ( JEFFERSON et al , 
(1987 , GUS Fusions ; fl-glucuronidase as a sensitive 
and versatile Gene Marker in Higher Plants, EMBO 
Journal 6 ; 3901-3907) ) pour obtenir le vecteur pBios 
170. 

Ce derive particulier du vecteur binaire pBi 101 
a ete choisi pour obtenir dans le meme temps une 
fusion traductionnelle entre la region amont, 

potentiellement codante du gene aconitase et la region 
codante du gene p -glucuronidase (Figure 16) . 

Ce vecteur binaire a ete introduit dans la souche 
desarmee d 1 Agrobacterium tumef aciens C58 f 3 et un clone 
recombinant a servi a transformer des racines 
d' Arabidopsis thaliana ( VALVEKENS et al, (1988, 
Agrobacterium Tumef aciens-mediated transformation of 
Arabidopsis Root Explants using Kanamycin Selection. 
Proceedings of the National Academy of Sciences of the 
United States of America 85 : 5536-5540) ) . Des cals 
transformes et des plantules regenerees ont ete 
testees pour la presence d'activite p -glucuronidase 
par le test histochimique. Une coloration bleue a ete 
detectee a la fois sur cals et plantules, indiquant la 
fonctionnalite du fragment promoteur clone. 
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EXEMPLE 10 : CARACTERISATION QUALITATIVE ET 
QUANTITATIVE DU PROMOTEUR ACONITASE D > ARABIDOPSIS 
THALIANA : 

L 1 expression dans les feuilles est detectee a la 
fois dans le mesophylle et dans les tissus 
conducteurs, l 1 activite sembl ant plus forte dans ces 
derniers. 

Dans les racines, 1 1 observation microscopique 
revele une activite ^-glucuronidase se limitant 
essentiellement a la zone d 1 elongation des pointes 
racinaires. 

Lors de 1» analyse par hybridation sur des ARN de 
differents organes et a differents stades, les 
chercheurs avaient detecte une activite forte dans des 
fleurs matures d 1 Arabidopsis. Les resultats sur les 
organes de reproduction male et femelle de colza en 
developpement montraient que cette augmentation 
intervenait dans la partie male. Les observations 
d 1 activite ^-glucuronidase sur les fleurs 
transgeniques confirment ces resultats et suggerent 
fortement qu»il s'agit d'une augmentation de 
1' activite transcriptionnelle du promoteur aconitase 
dans les grains de pollen. 

D 1 autre part, les inventeurs ont pu montrer que 
le promoteur conduisait a une assez forte activite 0- 
glucuronidase dans 1 1 albumen comparativement aux 
parties maternelles (teguments, placenta, tissu 
ovarien) . 

Cette activite dans l 1 albumen n'est pas 
surprenante car il s'agit d«un tissu de reserve fort 
utile lors de la germination. Bien que les inventeurs 
soient en presence d'une espece exalbuminee, ils ont 
pu visualiser precisement l 1 expression de ce 

promoteur aconitase dans ce tissu en cours de 
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developpement. L 1 embryon immature au stade coeur 
presente lui aussi une activite ^-glucuronidase ; a 
des stades plus avances, une expression constitutive 
est observee dans 1 1 embryon . 

Sur une graine mature, cette activite est 
restreinte a l 1 embryon et eventuellement a 1' albumen 
residuel. 

Lors de la germination de la graine, 1' activite 
du promoteur aconitase est tres forte dans 1 1 embryon 
et plus particulierement dans les cotyledons, ces 
derniers etant les organes de reserve ou le cycle de 
glycosylate est act if. 

Des analyses comparatives avec le promoteur CaMV 
35S montrent que le promoteur aconitase est environ 20 
fois plus faible dans les feuilles agees (voir tableau 
II, ci-dessous) : 



TABLEAU II: 



CONSTRUITS 
(nom du 
vecteur) 


PLANTES 
( trans formant 
primaire) 


ACTIVITE 
^-GLUCURONIDASE 
(nmol 4-MU/mg 
pr ote ine/minut e ) 


35S - GUS 


40-2 


10.99 


(pBi 121) 


40-4 


14.69 


Aco-GUS 


40-6 


0.27 


(pBiOS 170) 


40-9 


0.69 



(dosages effectues selon le protocole de Jefferson et 

al, 1987 , supra) 
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EXEMPLES DECRIVANT L 1 ISOLEMENT ET LA CARACTERI SAT ION 
DU GENE ACONITASE MAIS 



EXEMPLE 11 : OBTENTION D'UN FRAGMENT D 1 ADN 

COMPLEMENTAIRE D 1 UN GENE ACONITASE DU MAIS : 

Compte tenu des alignements de sequences 
proteiques des differentes Aconitases et IRE-BP (cf 
Figure n° 2) , les inventeurs se sont attaches a 
definir des zones conservees entre toutes ces 
proteines et si possible identiques entre les 2 
aconitases vegetales qui avaient prealablement ete 
caracterisees. Ces zones proteiques d'une longueur de 
6 a 7 acides amines devaient a la fois etre distantes 
d'une taille compatible avec la technologie PCR, etre 
dispersees sur toute la longueur de la proteine et 
surtout etre composees d 1 acides amines pour lesquels 
tres peu de codons existent, ce dernier point etant 
imperatif afin de concevoir des oligonucleotides 
degeneres engendrant un nombre de combinaisons 
limitees. Aussi, des zones contenant au moins une 
methionine ou un tryptophane ont ete 
preferentiellement retenues. Ainsi 6 zones ont ete 
choisies et 6 oligonucleodides degeneres, 3 sens ou 
brins codants et 3 antisens ou brins complementaires 
ont ete synthetises. Afin de faciliter les etapes de 
clonage, des bases supplementaires definissant des 
sites de restriction ont ete rajoutees a l'extremite 
5 1 de chaque oligonucleotide : site EcoRI pour les 
oligonucleotides sens (DI, DIV, DV) ; site Hindlll 
pour les oligonucleotides complementaires (DII, Dili, 
DVI) . Les differents oligonucleotides sont presentes 
ci-dessous avec la position des acides amines de la 
sequence proteique d 1 Arabidopsis et avec le nombre de 
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combinaisons correspondantes (chiffres entre 

paratheses) . Voir figure 21. 

Conformement aux donnees obtenues dans I'exemple 

2 et precisees dans la figure 11(b), 1 1 oligonucleotide 
degenere DI a ete congu en preferant, pour l'acide 
amine en position 32, une Alanine a la Serine trouvee 
chez Arabidopsis . En effet, la sequence de la pomme de 
terre et du melon presentaient cet amino-acid. 

Les oligonucleotides DII, Dili et DVI ont 
separement servi a amorcer des reactions de 
transcription reverse sur des ARN poly A+ isoles et 
purifies a partir de plantules de mais, etiolees et 
agees de 6 jours- Ces reactions ont ete realisees avec 
le kit Reverse Transcription System de la societe 
Promega et ont conduit a l'obtention de trois ADN 
complementaires. Sur ces derniers, plusieurs reactions 
PCR ont ete realisees avec differentes combinaisons 
d' oligonucleotides DI/DII ; DI/DIII ; DI/DIV ; DV/DVI 
et cela dans les conditions suivantes : 1 microlitre 
d'ADN complementaire est ajoute a 50 microlitres de 
melange PCR compose de dNTP 0 f 25 mM, 1,5 mM de MgC12 f 

3 unites de Taq Polymerase (Promega), 50 mM KC1, 10 mM 
Tris-HCl, 0,2 microM de chaque oligonucleotide. La 
reaction est realisee dans un DNA Thermal Cycler 
(Perkin Elmer Cetus Version 2.2) selon les etapes 
suivantes : 3 min de denaturation a 95 °C suivies de 40 
cycles composes de 3 0 secondes de denaturation a 95 °C, 

4 5 secondes d 'hybridation a 55 °C et d'une minute et 3 0 
secondes d 1 extension a 72 °C. 

Seulement une reaction d f amplification (amorces 
Dili et DIV) a donne un produit qui, de plus, 
presentait, apres electrophorese en gel d' agarose, une 
taille compatible avec le fragment theorique attendu 
(100 pb environ). Ce produit a ete introduit par 
ligation dans le vecteur pGEM-T de Promega selon les 
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recommandations du fournisseur (pGEM-T Vector System 
I) et transforme dans la souche d 1 Escherichia coli XLI 
Blue obtenue aupres de la societe Stratagene. 

Divers clones ont ete obtenus et le fragment 
insere de l'un d'entre eux a ete sequence selon le 
protocole du Kit de Promega, fmol DNA Sequencing 
System. La sequence qui a ete determinee demontrait 
que ce fragment etait hautement homologue avec la 
sequence d * Arabidopsis thaliana . Une homologie 
nucleique de 77,5 % et proteique de 87,5 % etait 
detectee (figure n° 17) . 

EXEMPLE 12 : ISOLEMENT ET DETERMINATION DE LA 
SEQUENCE D'UN GENE ACONITASE DU MAIS 

Une banque genomique EMBL 3 de mais construite 
apres digestion partielle par 1' enzyme Mbol de l'ADN 
isole de plantules (stade 2 feuilles) de la lignee B73 
a ete obtenue (Clontech referencee FL 1032 D) . Apres 
etalement de 2.10 6 phages puis hybridation avec le 
fragment d f ADN complementaire de mais de 100 bp 
identifie dans l'exemple 11 (figure 17), 9 clones 
genomiques ont ete isoles. Quatre d'entre eux se sont 
reveles identiques apres analyse par restriction. 

Sur un des clones, le clone Tl, un fragment Sail 
de 6,2 Kb hybridant avec le fragment d 1 ADNc a ete sous 
clone dans le vecteur pBS II SK+. Ce fragment a ete 
sequence initialemment aux extremites ainsi qu'a 
partir de 2 oligonucleotides specifiques du fragment 
d'ADN complementaire puis, ensuite, par la strategie 
de progression par oligonucleotides. Les premieres 
comparaisons avec l'ADN complementaire d' Arabidopsis 
ont montre que ce clone ne contenait pas l f extremite 
5 1 du gene aconitase de mais. 
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Afin d'essayer d'obtenir la sequence de 
l'extremite 5», les inventeurs ont entrepris de 
sequencer par la technique de progression par 
oligonucleotides la zone amont sur les autres clones 
genomiques. Seulement 2 d'entre eux, Rl et Jl 
presentaient une zone 5 1 du gene plus etendue que le 
clone Tl ; avec toutefois Jl qui ne contenait que 1060 
pb de plus que le clone Tl. 

Rl contient une insertion d 1 environ 15 kb d'ADN 
genomique de mais, comprenant notamment un fragment 
Sall-Hindlll d 1 environ 6800 pb recouvrant I'extremite 
5 1 du gene aconitase, et s'etendant de la position 
-4000 a la position 2841 (figure 18) . Ce fragment est 
purifiable par double digestion Hindlll, Sail ; Sail 
etant un site de restriction unique present sur le 
vecteur et contigu au site d" insertion du fragment 
genomique, a savoir BamHI, compatible avec l 1 enzyme 
Mbol . 

C'est au total 6036 paires de bases de la 
sequence d'un gene aconitase de mais qui ont pu etre 
determinees du clone Rl (Figure 18) avec une seule 
incertitude de quelques bases a la position 463 5 ; 
cette region correspond a un intron. Etant donne que 
les inventeurs ne disposaient pas de clone d 1 ADN 
complement a ire synthetise a partir de I'extremite 
polyAH- de ce gene aconitase de mais, les regions 
codantes ont ete definies par recherche d 1 homologies 
avec les sequences codantes d 1 Arabidopsis et celle de 
1 1 ADN complementaire incomplet du melon* Ceci a permis 
de demontrer qu'a partir des positions 53 0-54 0, la 
zone codante est tres homologue avec l'exon 2 
d' Arabidopsis et que, par la suite, absolument tous 
les exons d' Arabidopsis ont ete retrouves, attestant 
ainsi que 1 1 organisation genetique du gene aconitase 
est tres conservee entre ces 2 especes. Comme les 
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inventeurs n"ont pas pu determiner l'extremite 5' de 
l f exon 2 et qu'aucune homologie nette avec l f exon 1 
n'est definissable dans les 500 premieres bases de 
cette sequence, les exons ont ete nuraerotes en 
fonction des homologies Arabidopsis ; ils s»etendent 
done des positions : 

position exacte a definir a 623 pour l'exon 

2 ; 



-1122 


a 


1282 


pour 


1 


'exon 


3 


-1360 


a 


1452 


pour 


1 


•exon 


4 


-1664 


a 


1839 


pour 


1 


'exon 


5 


-1932 


a 


2093 


pour 


1 


'exon 


6 


-2335 


a 


2479 


pour 


1 


'exon 


7 


-2572 


a 


2714 


pour 


1 


'exon 


8 


-3074 


a 


3130 


pour 


1 


'exon 


9 


-3229 


a 


3308 


pour 


1 


'exon 


10 


-3407 


a 


3482 


pour 


1 


'exon 


11 


-3569 


a 


3754 


pour 


1 


'exon 


12 


-3842 


a 


3909 


pour 


1 


'exon 


13 


-4030 


a 


4148 


pour 


1 


'exon 


14 


-4241 


a 


4362 


pour 


1 


exon 


15 


-4474 


a 


4572 


pour 


1' 


exon 


16 


-4686 


a 


5165 


pour 


1' 


exon 


17 


-5239 


a 


5337 


pour 


1' 


exon 


18 


-5423 


a 


5665 


pour 


1« 


exon 


19 



-5764 a 5835 pour l f exon 20 (Partie codante 
uniquement) . 

Des signaux potentiels de polyadenylation sont 
presents aux positions 5069 et 5081. Seul l'exon n° 17 
a une taille differente de celui d ' Arabidopsis (+ 3 
paires de bases) et e'est aussi celui qui code pour la 
zone proteique presentant le plus de divergence malgre 
une sequence nucleique assez conservee. Ceci 



WO 95/20046 



PCT/EP95/00263 



71 

s»explique par 1 • addition d'un T a la position 5021 
sequence du mais (ou la deletion d'une base apres la 
position 3047 sur la sequence d ' Arabidopsis ) . 

II est assez remarquable de retrouver tous les 
introns situes a des positions identiques sur ces 2 
genes. Le tableau III presente la taille des exons et 
introns des deux genes Aconitase etudies. La taille 
des introns qui est en moyenne superieure chez le gene 
du mais differe grandement d'un intron a l 1 autre entre 
ces 2 genes : un intron relativement long chez 
Arabidopsis (intron 17 = 340 pb) peut etre court chez 
le mais (= 73) et reciproquement (intron 8 
d' Arabidopsis =91 et =359 chez le mais). 

La figure n° 19 montre I'alignement des 
aconitases Arabidopsis et mais attestant de la tres 
grande conservation de ces enzymes. Sur la figure 
n 6 20, c'est un alignement entre les 3 aconitases 
vegetales decrites dans cette invention (ZMACO = 
Aconitase mais ; ATACO = Aconitase Arabidopsis ; CMACO 
= Aconitase melon) presentant les homologies sur la 
partie commune aux trois sequences. 
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IN 


EXON 


INTRON 


ARABIDOPSIS 


MAIS 


ARABIDOPSIS 


MAIS 


1 


92 


? 


152 


? 


Z 


105 


7 


107 


498 


3 


161 


161 


104 


77 


A 


93 


93 


91 


201 


C 


186 


186 


84 


92 


o 


162 


162 


122 


241 


/ 


145 


145 


114 


92 




143 


143 


91 


359 




57 


57 


100 


96 


1 A 
1 U 


80 


80 


79 


98 


1 1 


76 


76 


241 


87 


12 


186 


186 


82 


87 


1 3 


68 


68 


85 


120 


1 4 


119 


119 


86 


92 


15 


122 


122 


89 


109 


1 0 


99 


99 


89 


? 


1 7 


477 


480 


340 


73 


18 


99 


99 


68 


84 


19 


243 


243 


107 


98 


20 


67 


72 







Tableau jEYTailles des exons et introns des genes Aconitase 
d'Arabidopsis thaliana et de Mais 
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REVINDICATIONS 

1. Proteine ayant une activite enzymatique 
d'aconitase, caracterisee en ce qu'elle comporte, soit 

i) la sequence en acides amines illustree dans la 
figure 1 ou une sequence presentant au mo ins 75 % 
d'homologie avec celle-ci, soit 

ii) une variante de la sequence i) comportant une 
deletion de jusqu'a 40 acides amines environ au niveau 
de 1 1 extremite NH 2 . 

2. Enchainement d' acides amines comprenant au 
moins un fragment de la proteine selon la 
revendication 1, ledit fragment consistant en : 

a) une sequence ayant une longueur comprise entre 
6 et 4 0 acides amines, ladite sequence presentant f sur 
toute sa longueur, au moins 90% d'homologie avec la 
partie correspondante de la sequence en acides amines 
de la figure 1, ou presentant au moins 60% d'homologie 
avec 1 1 une des sequences suivantes : 

I : DTVSMIEAYLRANKMFVDYSEPESKTVYSSCLELNLEDVE 

II : PLKEMKADWHS CLDNRV 

III : AVPKEAQSKAVEFNFNGTTAQLR 

IV : KGMTMSPPG 

V : AWMMRLWREHFANIRIVNKHLKGEVG 

VI : NVS E I KPGQ DVT WTNN 

VII : les acides amines 1 a 40 de 1' extremite NH 2 
de la proteine illustree dans la figure 1. 

ou 

b) une sequence ayant une longueur super ieure a 
40 acides amines, ladite sequence presentant, sur 
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toute sa longueur, au moins 75% d'homologie avec la 
partie correspondante de la sequence en acides amines 
de la figure 1. 

3. Enchainement d 1 acides amines selon la 
revendication 2 caracterise en ce qu'il comprend une 
sequence ayant une longueur comprise entre 40 et 100 
acides amines et presente, sur toute sa longueur, au 
moins 80% d'homologie avec la partie correspondante de 
la sequence en acides amines de la figure 1. 

4. Sequence d'acide nucleique caracterisee en ce 
qu'elle comporte soit : 

i) une sequence comprenant a la fois une partie 
5 1 non-transcrite, une partie transcrite, 
eventuellement avec des introns, et une partie 3 1 non 
transcrite, ladite sequence donnant lieu, apres 
transcription, epissage et traduction a la proteine 
selon la revendication 1, soit 

ii) le transcrit de la sequence i) ou son 
equivalent ADNc, soit 

iii) une sequence complementaire de la sequence 
i) ou ii) , soit 

iv) une sequence ayant une longueur d'au moins 25 
bases et etant capable de s'hybrider, sur toute sa 
longueur, avec les sequences i) , ii) ou iii) dans des 
conditions stringentes ou moyennement stringentes, 
soit 

v) un fragment consistant en au moins 25 
nucleotides consecutives de l'une quelconque des 
sequences i) , ii) , ou iii) , ou en au moins 10 
nucleotides consecutives lorsqu'il s'agit d'un 
fragment d'un intron de la sequence i) . 

5. Sequence d»acide nucleique selon la 
revendication 4 caracterisee en ce qu'elle comporte la 
sequence genomique illustree dans la figure 1 ou celle 
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illustree dans la figure 18, ou un fragment de 1'une 
de ces sequences. 

6. Sequence d'acide nucleique selon la 
revendication 5 caracterisee en ce qu'elle comporte 
au moins une partie d'une region non-codante ou d'un 
intron de la sequence genomique. 

7. Sequence d'acide nucleique caracterisee en ce 
qu'elle comporte au moins un intron du gene 
d'aconitase vegetale, ou une partie d'un tel intron, 
ladite partie ayant au moins 10 nucleotides et de 
preference au moins 30 nucleotides, 

8. Sequence d'acide nucleique selon la 
revendication 6 caracterisee en ce qu'elle presente 
une activite promotrice et se trouve au sein du 
fragment Hindlll (-1293) -Bglll (+45) de la sequence 
genomique de la figure 1. 

9. Sequence d'acide nucleique selon la 
revendication 4, capable d'inhiber le gene de 
l'aconitase caracterisee en ce qu'elle comporte un ou 
plusieurs fragments ayant une longueur d'au moins 6 
nucleotides , le ( s ) dit ( s) fragment ( s ) etant 
complementaire(s) d'au moins une partie du transcrit 
du gene de l'aconitase. 

10. Couple de sequences d'acide nucleique selon 
la revendication 4 caracterisee en ce que chaque 
sequence a une longueur comprise entre 15 et 300 
nucleotides et est capable de jouer le role d' amorce 
dans une reaction d' amplification d'acide nucleique. 

11. Plasmide caracterise en ce qu'il contient au 
moins l'une des sequence d'acide nucleique selon les 
revendications 5 a 10. 

12. Gene chimerique capable d'etre exprime chez 
les plantes caracterise en ce qu'il comporte : 

i) une region promotrice selon la revendication 

8, et 
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ii) une sequence heterologue transcrite, codante 
ou non, placee sous le controle dudit promoteur. 

13. Gene chimerique capable d"etre exprime chez 
les plantes caracterise en ce qu'il comporte : 

i) un promoteur" fonctionnel chez les plantes 
autre que celui naturellement associe avec le gene de 
1 1 aconitase , et 

ii) une sequence codant pour la proteine selon la 
revendication 1 ou pour un fragment proteique selon la 
revendication 2. 

14. Cellules vegetales transformees de maniere 
stable par une sequence d'acide nucleique selon l'une 
quelconque des revendications 4 a 13. 

15. Plantes transgeniques transformees de maniere 
stable par une sequence d'acide nucleique selon I'une 
quelconque des revendications 4 a 13. 

16. Anticorps monoclonaux ou polyclonaux capables 
de reconnaitre, de preference de maniere specif ique, 
la proteine selon la revendication 1 ou le fragment 
proteique selon la revendication 2. 

17. Precede pour la modification du metabolisme 
d'une plante, caracterise par 1 ■ introduction dans la 
plante d'un insert genetique comportant une sequence 
d"acide nucleique selon la revendication 4. 

18. Precede selon la revendication 17 caracterise 
en ce que la sequence d'acide nucleique comprend un 
promoteur fonctionnel chez les plantes, et sous le 
controle de ce promoteur, une sequence codant pour la 
proteine selon la revendication 1, ou pour un fragment 
proteique selon la revendication 2, 1' expression de 
cette sequence conduisant a une surproduction 
d 1 aconitase. 

19. Precede selon la revendication 18 caracterise 
en ce que la surproduction d 1 aconitase conduit a une 
surproduction d'au moins Hun des acides organiques du 
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cycle de Krebs ou du cycle glyoxylate, notamment le 
citrate, 1 " isocitrate, le succinate, le glyoxylate, le 
malate, 1 ' oxaloacetate, 1 'a-cetoglutarate, le 
fuiaarate. 

20. Procede selon la revendication 19 caracterise 
en ce que le promoteur est soit celui naturellement 
associe, dans la plante, avec le gene de l'aconitase, 
soit un promoteur heterologue au gene de l'aconitase. 

21. Procede selon la revendication 17 caracterise 
en ce que 1' insert genetique comprend un promoteur 
fonctionnel, et sous le controle de ce promoteur, une 
sequence inhibitrice selon la revendication 9, 
l 1 expression de la sequence conduisant a une 
inhibition de l 1 expression du gene de l'aconitase. 

22. Procede selon la revendication 20 caracterise 
en ce que 1« inhibition de I 1 expression du gene de 
l'aconitase conduit a une surproduction de 1 'Acetyl 
coenzyme-A et par consequent , a une reorientation du 
metabolisme ou du catabolisme polysaccharidique, 
lipidique et azote. 

23. Procede pour obtenir 1' expression 
constitutive, dans une plante, d'une sequence codante, 
1' expression etant particulierement forte lors de la 
germination des graines et lors de la maturation de la 
graine et du pollen, caracterise par 1 1 introduction 
dans le genome de la plante, d'un gene chimerique 
selon la revendication 12. 

24. Gene chimerique capable d'etre exprime chez 
les plantes caracterise en ce qu'il comporte : 

i) un promoteur fonctionnel chez les plantes, 

ii) une sequence transcrite, codante ou non, 
placee sous le controle dudit promoteur, 

iii) un ou plusieurs introns du gene de 
l'aconitase vegetale, selon la revendication 6 ou 7 . 
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FIGURE Hi) 
Hindlll 

aa2ctttcgtccatattaaaataaacatttttt:ttttttatataacttctttcttattgatattag-1225 
cttaaaagatcgtataaacaaacttatatacgatcaaacaaactaaaaaagagagttctttatcaaaaaaaa-1153 
acaaactaaaaagagacgataaatgaaagagataacaatgatatgtaattgtccttacataaaaaaaaaata-1081 
ttgagccacgccaaatctaaaacgatttcgtt:aaacatat:atagtt:ctcgat:atttatcaacaaagacgatg>1009 
taattcgtaatctatatacgtacatcttcttaattttttaaaaaatataaaaaggtgcttcagattcaaggg -937 
actgaaactagtgaggtttcttaaaagcagatatatacactgaccacgtt caggttaatagttagtagattt - 8 65 
ttaggtggatagtaatatattgatggacaatatttaaatacagactataatatttaagagacttgaagtgrt -793 
cctaagagtaaatttaattatacattttaatcatggcctgaaaaactaaacaaggaggggtagaataattaa -721 
tcatctcagcagctttccatctgacacaccattcagctaaacgacattgtttaatctctaaccaaactggga -649 
tagaccgaactgggtacaaagatgggttaaactggctaggcccaaattaatcagaacataaatttcgaacgg -577 
agcgacccatttccaaaataaaaaaatgtatttttcatatatatatatatttttttttttaaatcgttgcat -505 
gcaggttggtggcgatattttttggttttgtcacaggtggtggtaaataaacgacgatcattgaatattttt -433 
ggtgtcttgtatatgtttgtgtcattgtgtgtattttttttttggtgtgttgtaacgacgatcattcttgta -361 
tatgtttgtcagaaattaaggtttttttaatcaatcaatgccatgtgaaattgagaaaccttgaagaaaatt -289 
ggattacataaaactagatactatagagaagaggcacatatcagattggtggattataagtttgtgaaaata -217 
aaatcatgattgaacagatattaattcacttgatacaaaaaaaagcaaagaatggatattcacaaaaaaaag -145 
aaagttggataattaagaaaatagaatataaaataaaaaaataaatcaaacagccatcagttctgacgaaaa -73 



gagcccaccacggatctgtcagatttatttccttcttaca |tataa| aaaaaatctgaatcggctcaggctcgt -1 

Bgl2 

GTA GCC TCA CCA ACT CCG CTT ATA AAC TTT CTC TCT TCT GAA AAC AGA TCT CTC 54 
Val Ala Ser Pro Thr Pro Leu lie Asn Phe Leu Ser Ser Glu Asn Arg Ser Leu 

TAC TTT GCT TCT TCA CTC GAC TTG TAT CTA TCA TCC ATG G gtatcgatttctctgttt 112 
Tyr Phe Ala Ser Ser Leu Asp Leu Tyr Leu Ser Ser Met 

acgatccaaaatgattcatgtttcttatttcttcttctcgccgatgctgattttccagctatttttcgtttt 184 

tttgaaatctggttctgtattttgatttgctgtgtggat;ctctgtttct:gatgtgttttcagCT TCC GAG 254 

Ala Ser Glu 
EcoRX 

AAT CCT TTC CGA AGC ATA TTG AAG GCG TTA GAG AAG CCT GAT GGT GGT GAA TTC 308 
Asn Pro Phe Arg Ser He Leu Lya Ala Leu Glu Lys Pro Asp Gly Gly Glu Phe 

GGT AAC TAC TAC AGC TTA CCT GCT TTG AAC GAT CCC AGG ATC G gtgagtttcctttt 365 
Gly Asn Tyr Tyr Ser Leu Pro Ala Leu Asn Asp Pro Arg He 

atctctgatagatattatraatattttgttagaagacgttgttatgatctcgttggtgagagttttatgagag 437 

aaatgttgtggtggatgacagAT AAA CTA CCT TAT TCC ATT AGG ATA CTT CTT GAA TCG 496 

Asp Lys Leu Pro Tyr Ser He Arg He Leu Leu Glu Ser 

GCC ATA CGT AAC TGT GAT GAG TTC CAA GTT AAG AGC AAA GAT GTT GAG AAG ATT 550 
Ala He Arg Asn Cys Asp Glu Phe Gin Val Lys Ser Lys Asp Val Glu Lys He 
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FIGURE 1 (ii) 



CTT GAT TGG GAG AAT ACT TCT CCC AAG GAG GTT GAG ATT CCG TTC AAG CCT GCT 604 
Leu Asp Trp Glu Asn Thr Ser Pro Lys Gin Val Glu He Pro Phe Lys Pro Ala 

CGG GTT CTT CTT CAG gtagacaatgattggttgctatacacattcttgatgacataatgatgtttc 670 
Arg Val Leu Leu Gin 

tgatttcctgaaaatgctagaatgtgatatcattttttctatttgtttttcagGAC TTT ACT GGT GTT 738 

Asp Phe Thr Gly Val 

CCT GCT GTT GTT GAT CTT GCT TGC ATG AGA GAT GCC ATG AAT AAT CTC GGT GGT 792 
Pro Ala Val Val Asp Leu Ala Cys Met Arg Asp Ala Met Asn Asn Leu Gly Gly 

GAT TCT AAT AAA ATT AAT CCG CTG gttagtttcctcgctttttactgagattggttaatgatt 855 
Asp Ser Asn Lya He Asn Pro Leu 

tgtgttcttttggtatgctataaggtttgatacaaggccttgataattgcagGTC CCT GTA GAT CTT 922 

Val Pro Val Asp Leu 

GTC ATT GAC TAG TCC GTT CAG GTG GAT GTG GCG AGA TCA GAG AAC GCA GTG CAG 976 
Val He Asp Tyr Ser Val Gin Val Asp Val Ala Arg Ser Glu Asn Ala Val Gin 

GCA AAC ATG GAG CTT GAG TTC CAG CGT AAC AAG GAA AGA TTT GCT TTT CTT AAG 1030 
Ala Asn Met Glu Leu Glu Phe Gin Arg Asn Lys Glu Arg Phe Ala Phe Leu Lys 
BanHI 

TGG gGA TCC AAC GCC TTT CAC AAC ATG CTT GTC GTA CCT CCT GGA TCT GGA ATA 1084 
Trp Gly Ser Asn Ala Phe His Asn Met Leu Val Val Pro Pro Gly Ser Gly He 

GTT CAT CAA gtaagtagaggattcagggacaacggtattgcttggaaacttaaagtatttttatgcta 1152 
Val His Gin 

aattctataattttgcaattgacagGTC AAC CTA GAA TAC CTT GCC AGA GTT GTT TTC AAC 1213 

Val Asn Leu Glu Tyr Leu Ala Arg Val Val Phe Asn 

ACA AAT GGA CTT CTT TAC CCA GAC AGT GTT GTT GGC ACA GAC TCT CAC ACC ACT 1267 
Thr Asn Gly Leu Leu Tyr Pro Asp Ser Val Val Gly Thr Asp Ser His Thr Thr 

ATG ATT GAT GGA CTG GGT GTT GCT GGA TGG GGA GTT GGC GGT ATA GAA GCG GAA 1321 
Met He Asp Gly Leu Gly Val Ala Gly Trp Gly Val Gly Gly lie Glu Ala Glu 

CGA CCG ATG CTT GGT CAG gtaaatcagatgctctttcggtcgagaactcatagctaactgtctaa 1386 
Arg Pro Met Leu Gly Gin 

cctctttctgaaactttggttctaaactacatcctttcaataattctaatagactttccatctctttatatg 1458 

cagCCA ATG AGC ATG GTC CTA CCC GGT GTT GTG GGT TTC AAG CTA ACG GGA AAG 1512 
Pro Met Ser Met Val Leu Pro Gly Val Val Gly Phe Lys Leu Thr Gly Lys 

TTA AGA GAT GGA ATG ACA GCT ACT. GAT TTG GTC TTA ACA GTG ACT CAG ATG TTG 1566 
Leu Arg Asp Gly Met Thr Ala Thr Asp Leu Val Leu Thr Val Thr Gin Met Leu 

EcoRI 

AGG AAA CAT GGA GTA GTT GGA AAG TTT GTT GAA TTC CAC G gtacgttgataaaagatt 1624 
Arg Lys His Gly Val Val Gly Lys Phe Val 5Iu 2ne His 

tgatatcatatttcatatatgtctcttatttacttacatagtaccttaccgagttaggctagctcacatatg 1696 

catcgactgctttttcatacacagGG GAA GGG ATG AGA GAA TTG TCT TTA GCT GAC CGT 1755 

Gly Glu Gly Met Arg Glu Leu Ser Leu Ala Asp Arg 

GCT ACA ATT GCC AAT ATG TCT CCT GAG TAC GGT GCG ACC ATG GGA TTC TTC CCA 1809 
Ala Thr He Ala Asn Met Ser Pro Glu Tyr Gly Ala Thr Met Gly Phe Phe Pro 

GTC GAT CAT GTC ACT TTG CAG TAT CTA AGG TTG ACA GGC AGG AGC GAT GAC ACT 1863 
Val As£ His Val Thr Leu Gin Tyr Leu Arg Leu Thr Gly Arg Ser Asp Asp Thr 
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FIGURE 1 (iii) 

gtaagaaaatgactcacatttcgggaaaatcttcattatttagtgtgttaaagactttcataatggtattga 1935 

tttgtgaattggattgcagGTC TCC ATG ATA GAG GCG TAT TTA CGA GCA AAC AAG ATG 1993 
Val Ser Met He Glu Ala Tyr Leu Arg Ala Asn Lys Met 

The Si Sp lyr stl Su gtaaaCCttgggcatccttaatac "catttcttatgcctatt g tca 2058 

tatatcatatttgcataacatatgcttcacttggaacttgttgcacatctcagCCG GAG AGT AAG ACA 2126 

Pro Glu Ser Lys Thr 

Zll I™ HI Z GT f TG «* P G *™ CTC GAG GAT GTG GAA CCT TGT GTT TCT 2180 

Val Tyr Ser Ser Cys Leu Glu Leu Asn Leu Glu Asp Val Glu Pro Cys Val Ser 

BamHI 

GlJ Pro L^s AG 9taCtattagtgaatgattcgaca 5 a aa a ttatct ai gatcc a ttct a cttacaatg 2248 

tctattctctgtgcacaatacagG CCT CAT GAT CGT GTT CCT TTG AAG GAA ATG AAA GCG 2308 

Arg Pro His Asp Arg V a l Pro Leu Lys Glu Met Lys Ala 

2£ J™ I CT ^ GC ^ f C M AGA CTA GGA wc gttagtactctoctttctg 2366 

Asp Trp His Ser Cys Leu Asp Asn Arg Val Gly Phe Lys 

ttgagaagatgtgaatgcttgcagtcccgagagcttaatttgtaggaaattatgacacctctagctattgtt 2438 
actgtaattttgaaagaatggtacgtattcgagtctttaagcgggtccaataaactaacttgtacgttctgc 25 
aacacttctgaatttataacctacttccattttttcaaaaatagtggttagtgatactacttatccatgatt 

ttccagGGT TTC GCT GTA CCT AAA GAA GCA CAG AGT AAG GCT GTA GAG TTC AAT 2636 
Gly Phe Ala Val Pro Lys Glu Al a Gin Ser Lys Ala Val Glu Phe Asn 

Jin G W TH C f™ AGA ^ GGA CTT CTT ATA GCA GCA ATC 2690 

Phe Asn Gly Thr Thr Ala Gin Leu Arg His Gly Asp Val Val He Ala Ala He 

ACC AGT TGC ACA AAT ACT TCA AAC CCT AGT GTA ATG CTT GGC GCT GCC TTA GTT 2744 
Thr Ser Cys Thr Asn Thr Ser Asn Pro Ser Val Met Leu Gly Ala Ala Leu Vai 

Alt Lys Lys S 5 2 P 2 2J 2 Su ^gtgatagtgatttaata 2805 

tctttatgtgcaatggaaataatagaagtgtttgaaatttctcaattatagGTT AAG CCA TGG ATC 2871 

Val Lys Pro Trp He 

AAA ACT AGT CTT GCT CCA GGC TCT GGA GTT GTA ACA AAG TAC TTG GCA AAG AG 2924 
Lys Thr^Ser Leu Ala Pro Gly Ser Gly Val Val Thr Lys Tyr Leu Ala Lys 

gtctgctgcaaatacaccgttgaatgttttgttatttatttccttatccttgtattgtgtggtoctgagttt 2996 

tcaagtCttgcagT GGC TTG CAG AAG TAC TTG AAT CAG CTC GGC TTC AGT ATC GTT 3052 
Ser Gly Leu Gin Lys Tyr Leu Asn Gin Leu Gly Phe Ser He Val 

GGT TAT GGG TGC ACC ACA TGC ATT GGA AAC TCG GGG GAT ATC CAT GAA GCT GTG nnc 
Gly Tyr Gly Cys Thr Thr Cys He Gly Asn Ser Gly Sp He SI SS Ala S3 

SI Set S S Val Asp As n ^ tgaagtaatgcttcttcacttg 317C 

aattttcgaaggtcaaactaaaagatttctcatatatgtacaagAC TTG GTG GCA TCC GCT GTG 3234 

Asp Leu Val Al a Ser Ala Val 

TTG TCT GGG AAC AGA AAT TTT GAG GGA CGT GTT CAC CCG TTA ACA AGA GCT AAC 32B8 
Leu Ser Gly Asn Arg Asn Phe Glu Gly Arg Val His Pro Leu Thr Arg Ala Asn 
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FIGURE 1 (iv) 



TAT CTA GCT TCC CCA CCG CTT GTT GTA GCC TAT GCT CTG GCT GGG ACT gtatgtt 3343 
Tyr Leu Ala Ser Pro Pro Leu Val Val Ala Tyr Ala Leu Ala Gly Thr 

aatgcaactctaaagccatttcacaacattcaagcattcttgttatatgaagcacagaatcattcacatgat 3415 

attcttgtagGTT GAC ATT GAT TTT GAG ACA CAG CCC ATT GGA ACT GGG AAA GAT 3470 
k Val Asp lie Asp Phe Glu Thr Gin Pro lie Gly Thr Gly Lys Asp 

GGA AAA CAG ATA TTT TTC AGG GAC ATT TGG CCC TCT AAC AAA GAA GTT GCT GAG 3524 
Gly Lys Gin lie Phe Phe Arg Asp lie Trp Pro Ser Asn Lys Glu Val Ala Glu 

gtaaatatatatgggctacttgggtaatacgtaaacaatgagatattataagtggaggggatgccaaattct 3596 



ctgtttcgatttttcagGTT GTT CAA TCT AGT GTC CTT CCT GAT ATG TTC AAA GCT ACA 3655 
Val Val Gin Ser Ser Val Leu Pro Asp Met Phe Lys Ala Thr 
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ATG gtataatctcacttttttttttatccttttgaaaacatcaaattcaagctctttggtcatgaggttg 4157 
Met 

Hindi 1 1 

gggtaggattacgataagctttgaataagcactacagctctactcttagctataggtctactgtatctagcc 4229 



taggactgaatgtagtagattagagctgttgtgagttggtttatagaacagttagtgaaggctgaggtaata 43 01 

ataatgtctcagcagattgtcttgggggtggaaattttgttgtttgattctctgatttggtcagttggaatt 4373 

aagaatagcagttcatagctttgttttaatcagattattctctcctcgtgctgtacagAAA TAT AGG 4440 

Lys Tyr Arg 

AAC GAG GGA CGC GAC ACA ATC ATT TTG GCT GGT GCT GAA TAC GGT AGT GGA AGT 44 94 
Asn Glu Gly Arg Asp Thr He He Leu Ala Gly Ala Glu Tyr Gly Ser Gly Ser 

TCT CGT GAT TGG GCT GCC AAG GGT CCA ATG CTT CTG gtacattttctgtatttaacaaa 4553 
Ser Arg Asp Trp Ala Ala Lys Gly Pro Met Leu Leu 

cacgttcttacacttattttatgcggtttctttaaaaaattgtgacaacagGGT GTG AAA GCT GTG 4619 

Gly Val Lys Ala Val 

EcoRZ 

ATT TCA AAG AGC TTC GAG C GA ATT CA C CGA AGC AAT TTG GTG GGA ATG GGA ATC 4673 
He Ser Lys Ser Phe Glu Arg lie His Arg Ser Asn Leu Val Gly Met Gly He 
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FIGURE l(v) 



ATA CCT TTG TGC TTC AAG GCG GGA GAA GAT GCT GAG ACC CTT GGC CTA ACG GGT 4727 
lie Pro Leu Cys Phe Lys Ala Gly Glu Asp Ala Glu Thr Leu Gly Leu Thr Gly 

CAG GAG CTT TAC ACC ATT GAG CTC CCA AAC AAT GTT AGT GAG ATC AAA CCA GGA 4781 
Gin Glu Leu Tyr Thr lie Glu Leu Pro Asn Asn Val Ser Glu lie Lys Pro Gly 

CAA GAT GTA ACA GTC GTC ACA AAC AAT GGC AAA TCT TTC ACA TGT ACA CTC CGA 4835 
Gin Asp Val Thr Val Val Thr Asn Asn Gly Lys Ser Phe Thr Cys Thr Leu Arg 

Xbal 

TTT GAC ACA GAG gtaagttatctctaaatgatatattttcgtcttttcgtctttggatttttttttt 4902 
Phe Asp Thr Glu 

agctctaaaacaaaatgagatgagataagtaagaggaatttggaatcgacagGTG GAG TTG GCT TAT 4969 

Val Glu Leu Ala Tyr 

TTC GAT CAC GGA GGG ATT TTG CAA TAC GTT ATC AGG AAC TTG ATC AAA CAA taa 5023 
Phe Asp His Gly Gly lie Leu Gin Tyr Val He Arg Asn Leu He Lys Gin 

atctggtaacaccagagacrtgagttatatiatcccaaggttlzgttgcaataaaaatgtttgcagggaggagg 5095 

acgagaatgactttaatttaaacttttgcttttgttcttcttcgtctcttgcttcgtgctagtcaattggaa 5167 

acattatcactgtcgagtcattttttttctttcaaataaacatgcgagctctttttttgttgttgttgttca 5239 

taagcattgtcaatgctgcattgatagaagtatactctaccattagaaaataaacacaaatacacaaagtaa 5311 

tctaaagagctagaggatgaaaattatctgtgaaggttgtacaaaaacattaaaaaaaatctgagatgatcc 5383 

aaaggattgattatcacattcgaagtgatggt:tcagagattacctctggaatgl:tgt:gt:agagctgatgaac 5455 

tagagagcgacatga 5470 
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FIGURE 2Ci) 
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FIGURE 2 (ii) 
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FIGURE 2 (iii) 
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FIGURE 3 (i) 
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FIGURE 3 (ii) 
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FIGURE 3 (iii) 
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FIGURE 4 (i) 

gg -1 

CAC GAG GCA AAA ACA GAA AAT GCA GTA CAG GCA AAT ATG GAA CTT GAA TTT AAA 54 
His Glu Ala Lys Thr Glu Asn Ala Val Gin Ala Asn Met Glu Leu Glu Phe Lys 16 

CGA AAC AGG GAA AGA TTT GGC TTT CTG AAA TGG GGA TCG AGT GCT TTC CAC AAC 108 
Arg Asn Arg Glu Arg Phe Gly Phe Leu. Lys Trp Gly Ser Ser Ala Phe His Asn 34 

ATG CTT GTC GTA CCT CCA GGA TCT GGT ATA GTT CAC CAG GTT AAT CTG GAA TAC 162 
Met Leu yal Val Pro Pro Gly Ser Gly He Val His Gin Val Asn Leu Glu Tyr 52 

CTT GGC CGA GTG GTA TTC AAC ACA AAC GGT TTG CTT TAC CCT GAT AGT GTT GTG 216 
Leu Gly Arg Val Val Phe Asn Thr Asn Gly Leu Leu Tyr Pro Asp Ser Val Val 70 

GGA ACC GAT TCA CAC ACA ACG ATG ATT GAC GGA TTG GGT GTT GCT GGT TGG GGT 270 
Gly Thr Asp Ser His Thr Thr Met He Asp Gly Leu Gly Val Ala Gly Trp Gly 8 8 

GTT GGT GGG ATA GAA GCA GAA GCT GCA ATG CTT GGA CAG CCA ATG AGC ATG GTC 324 

Val Gly Gly He Glu Ala Glu Ala Ala Met Leu Gly Gin Pro Met Ser Met Val 106 

TTG CCT GGC GTT GTT GGT TTT AAA TTA GTT GGA AAG CTG AGA AAT GGT GTA ACA 37 8 

Leu Pro Gly Val Val Gly Phe Lys Leu Val Gly Lys Leu Arg Asn Gly Val Thr 124 

GCT ACA GAC TTG GTT TTG ACT GTG ACT CAA ATG CTC AGG AAG CAT GGT GTT GTT 432 

Ala Thr Asp Leu Val Leu Thr Val Thr Gin Met Leu Arg Lys His Gly Val Val 142 

GGC AAG TTT GTG GAG TTC TAT GGG GAA GGT ATG GGT GAA CTA TCT TTG GCC GAC 486 

Gly Lys Phe Val Glu Phe Tyr Gly Glu Gly Met Gly Glu Leu Ser Leu Ala Asp 160 

CGT GCC ACA ATT GCC AAC ATG TCC CCT GAA TAT GGT GCA ACA ATG GGA TTC TTT 54 0 

Arg Ala Thr He Ala Asn Met Ser Pro Glu Tyr Gly Ala Thr Met Gly Phe Phe 178 

CCT GTG GAT CAT GTC ACC CTG CAG TAT CTA AAA CTG ACT GGA AGA AAA GAT GAA 594 

Pro Val Asp His Val Thr Leu Gin Tyr Leu Lys Leu Thr Gly Arg Lys Asp Glu 196 

ACA ATT TCT ATG ATA GAA TCT TAC CTG CTG GCT AAT AAG ATG TTT GTA GAC TAC 64 8 

Thr lie Ser Met He Glu Ser Tyr Leu Leu Ala Asn Lys Met Phe Val Asp Tyr 214 

AGT GAG CCT CAA GTT GAA AGA GTG TAC TCC TCT CAT ATA GAA CTG AAT CTT TCT 702 

Ser Glu Pro Gin Val Glu Arg Val Tyr Ser Ser His He Glu Leu Asn Leu Ser 232 

GAT GTC GAA CCA TGC ATA TCA GGT CCA AAA AGA CCA CAT GAT CGA GTT CCC TTG 756 

Asp Val Glu Pro Cys He Ser Gly Pro Lys Arg Pro His Asp Arg Val Pro Leu 250 

AAA GAG ATG AAA GCT GAT TGG CAT GCA TGC CTT GAC AAC AGA GTT GGA TTC AAG 810 

Lys Glu Met Lys Ala Asp Trp His Ala Cys Leu Asp Asn Arg Val Gly Phe Lys 26B 

GGT TTT GCC ATA CCA AAG GAA <?CT CAA GTA AAG GTT GCA GAG TTC AAT TTT CAC 8 64 

Gly Phe Ala He Pro Lys Glu Ala Gin Val Lys Val Ala Glu Phe Asn Phe His 286 

GGA TCC CCA GCT CAG CTT AGG CAT GGG GAT GTT GTA ATT GCA GCT ATC ACT AGC 918 
Gly Ser Pro Ala Gin Leu Arg His Gly Asp Val Val He Ala Ala He Thr Ser 304 

TGC ACA AAT ACC TCT TCC AGC GTT ATG CTT GGA GCT GCT TTG GTG GCT AAA AAG 972 
Cys Thr Asn Thr Ser Ser Ser Val Met Leu Gly Ala Ala Leu Val Ala Lys Lys 322 

GCT TGT GAG CTT GGG CTA GAG GTT AAG CCC TGG ATT AAG ACA GTC TTG CTC CAG 1026 
Ala Cys Glu Leu Gly Leu Glu Val Lys Pro Trp He Lys Thr Val Leu Leu Gin 340 

GCT CTG GGG GTG GTG ACG AAA TAT TTG GCG AAG AGT GGC TTG CAA AAG TAT CTT 1080 
Ala Leu Gly Val Val Thr Lys Tyr Leu Ala Lys Ser Gly Leu Gin Lys Tyr Leu 358 

AAT CAG CTA GGA TTC AAT ATA GTT GGT TAC GGA TGT ACT ACT TGC ATT GGC AAT 1134 
Asn Gin Leu Gly Phe Asn He Val Gly Tyr Gly Cys Thr Thr Cys He Gly Asn 376 
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FIGURE 4 (ii) 
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FIGURE 9 
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FIGURE 18(a) 29/36 
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ATCGAATGTT CTCTCCTGAT GCAATTTAAC TATATGTTAT TGACATATTT CC CTTTGT GT TCTCTATCCA G GT GAA GGT ATG GGT 

E G M G> 

2590 2600 2610 2620 2630 2640 2650 2660 

• • »•» 

AAG CTG TCT TTA GCT GAC AGG GCC ACA ATT GCG AAC ATG TCA CCA GAA TAT GGA GCT ACC ATG GGC TTC AAC CCT 
K L S LADRAT I ANM SP E YG A T M G F N P> 

2670 2680 2690 2700 2710 2720 2730 

• • • ■ • » • 

GTG GAC CAT GTG ACA TTG GAT TAC CTT AAA CTG ACA GGC CGC AGT GAT GAA ACT GTATGT TTTAGTACCT 
VDHVTLDYLKLTGRSDE T> 

2740 2750 2760 2770 27B0 2790 2800 2810 2820 

GCAAATGCAA ATTATTTTTG GTTTCTATTG CGATGGTAGT TTCTGGCAAA CATACTCATA AAATATTTGT CAATGCATAC ATATCTCCCC 

2830 2840 2850 2860 2870 2880 2890 2900 2910 

• • • ■ * • • ■ » 

CTCTGGGGAT GTGTGAATTC AAGCTTCTCT ACTGCCTTTC TTCAGCTAGG ATCTCTTCCA TATTTGATTC CGAAAAGTGA CTCACTAAAC 
2920 2930 2940 2950 2960 2970 2980 2990 3000 

• • * • * • • a • 

TTCAAGGACA CAAAGTCGTC TCTCCCAAAA TTCCATGTCC TTATTGCCAT CTATACTACC ATTTCCATTC AGCGT CTT AA TTTCGTATAT 

3010 3020 3030 3040 3050 3060 3070 3080 

■ «••••• • 

AGAACATCAT TTTCATTTTT GTGAGAAGAA TT CTC CATC C ACTCCATTTT ATAAGTTAAA CCTGTTCATT TAG GTG TCA ATG ATT 

V S M I> 

3090 3100 3110 3120 3130 3140 3150 3160 

• • » • *•»» 

GAA GCA TAC CTC CCA CCC AAT AAA ATG TTT CTG GGC TAC AAT GAG GTAGATTAAA TGAGGTAGAT TTCTTTACTC 
EAYLRANKMFVGYNE> 

3170 3180 3190 3200 3210 3220 3230 3240 

• **•*■ • » 

ATTGCAGCAC TTGAGTCCCA GATATTATTT TGTGTGCAAA ATATAAGCAT ATTTGCATAT GTTGGCAG CCT CCA ACA GAG AGA ATA 

P P T E R I> 
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3250 3260 3270 3280 3290 3300 3310 3320 

• • 

TAC TCA TCT TAT CTT GAG CTG AAC CTT GAT GAG GTG GAG CCT AGC ATG TCT GGC CCA AAG AG GT ACGATCCTGA 
YSSYLELNLDEV£PSMSGPKR> 

3330 3340 3350 3360 3370 3380 3390 3400 

GACTC .CTG ATTGGAAGTT ATCCCACTTC ATATTTTTAG GGGTCGGGTC GGGTTGTATA TTGGGCTTAT GGTTCTGAAC TTGTAG G 

3410 3420 3 430 3440 3450 3460 3470 3480 

V CGT CTC CCT 770 AAG GAA ATZ TCA 702 CAT GCT TGC CTG GAC AAC AAA GTT GCG TTC AAG 

PHDRVPLK E"K_SDWHACLDNKVCFK> 
3490 3500 3510 3520 3530 3540 3550 3560 3570 

GT AAC TGC TTAGCTGTAT ATCATATCTT TTTGCATAAC ATTTCCTTCA TATGATG7TA CTTACTCGAT ACATCTATCA GTTTCCAG CCT 

G> 

3580 3590 3600 3610 3620 3630 3640 

* 

TTT CCA CTG CCA AAG GAG CAG CAG GAT AAG GTT GTC AAA TTT GAC TTT CAT GGG GAG CCA GCA GAA ATG AAG CAT 
FAVPK£ QQ DK VVKFDFHCQPAEMKH> 

365 ° 366 ° 36? 0 3680 3690 3700 3710 3720 

GCT ACT GTT GTT ATA CCA GCA ATA ACT ACC TCC ACA AAC ACC TCA AAT CCT ACT GTT ATG CTT GCT GCT GGT CTT 
GSVVIAAI TSCTNTSNPSVMLGACL> 
3730 3740 3750 3760 ■ 3770 3780 3790 3800 

CTA GCT AAG AAA GCT TGC GAG TTC GCT CTT GAG GTTACT CCTCTTGT A A TGCAATCATD CGCTCTT CT G CTGAGTCCCT 
V AKKACELGLE> 

3810 3 820 3830 3840 3850 3860 3870 3880 

* • • • 

TTCTGTCCTT TCTCTTCATC TGAGATAGCA CTTCTTTTCA G CTT AAA CCA TOG CTC AAG ACA ACC CTT GCC CCT CCA TCA 

VKPWVKTSLAPCS> 

3890 3900 3910 3920 3930 3940 3950 3960 

• * • 

CCA GTT GTC ACG AAG TAC TTC CTT CAG AG G TATTTGGCAT TCTTTAAATG CCTATCAGAT CAGGAGTTCT CAGGACTTAT 
GVVTKYLLQS> 

3970 3980 3990 4000 4010 4020 4030 4040 

CATTGAAACC TAGAATTTCA ATCTCTATCA GATCTCATTT AATTCAATCT GGTGATTTCT AATTTACAG T GGT CTT CAA GAA TAC 

C L Q E Y> 

4050 4060 407 ° 4080 4090 4100 4110 4120 

• • " 

CTC AAC CAG CAA GGA TTC CAT ATC GTT CGC TAT GCC TCT ACC ACT TCC ATT CCA AAC TCT GGT GAT TTC GAT GAA 
LNQ 0 GFH * V CYCCTTCICNSGDFDE> 

413 ° 4140 4150 4160 4170 4180 4190 4200 

* * **•••• 

TCT CTA TCA ACT GCC ATT ACA GAA AAT C GT AACTTAATTA TACGATGATT GACTATTTAG CTCTAACAAA TTTCACTTTT 
SVSTAITEND> 



4210 4220 4230 4240 



4250 4260 4270 4280 



TTTCTTTATG ATTGGCTTAT TGCTCAGCTC TTTTCCACAG AT CTT CTT GCT GCT GCT CTT TTC TCG GGT AAC CGT AAC TTC 

VVAAAVLSGNRHF> 
A2$ l 430 ° 4310 4320 4330 4340 4350 

GAG GCT CCT GTC CAC CCT TTA ACT CGC CCT AAC TAT CTT GCT TCG CCA CCT CTT GTT ATT CGT TAT CCA CTT GCC 
ECRV HPLTRANYLASPPLVIRYRLA> 
4360 4370 4380 4390 4400 4410 4420 4430 4440 

CCA ACT GTAAATAC TTTTCTCTCA CAAACTATTC TAGGGCTCCA TCCTCAATAA ACTTCACAAC ATCTGTGTTT CTGCTTTCAT 

G T> 



4450 4460 4470 4480 4490 4500 



4510 



GCAACTAGTT AATATTTGAA GTTCTACTTT CAG CTT GAT ATT GAT TTT CAC AAA GAC CCC ATT GCA TTT GGA AAC CAT 

V DIDFEKEPICFGKD> 
4520 4530 4540 4550 4560 4S70 4580 4590 

GCC AAG GAA GTC TAC TTC AGC GAT ATA TGC CCC TCC ACA GAA GAA ATT GCT GAG CTATATTC TGTACTCAAA 
GKEVYFRDIWPSTEEIAE> 

4600 4610 4620 4630 4640 4650 4660 4670 4680 

* ■ » • . • 

CTTTCTTGTA TTTCAGTTAC TATAGTACAT TCATCTATAC CAGAT AA TTATCTTGTA GCAGTAATAA TTGTTATTCA AATGCTACCT 

4690 4700 4710 4720 4730 4740 4750 
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TACAG GTT GTC CAA TCG AGT GTG CTG CCT GAC ATG TTC AAG GGC ACC TAT GAG GCT ATC ACA AAA GGC AAC CCA 
VVQSSVLPDMFKGTY£AITKGNP> 

4760 4770 4780 4790 4800 4810 4820 

* • • ■ * * • 

ATG TGG AAC CAG CTA ACT GTC CGA GAA GGA TCA CTC TAC TCA TGG GAT TCC AAA TCC ACT TAC TCC ATG AGG AAG 
MWNQLTVREGSLYSWDSKSTYSMRK> 

4830 4840 4850 4860 4870 4880 4890 4900 

» * * •«* « ■ 

CTT ACT TTA AGG AAC ATG ACC ATG TCC CCA CCT GCC CCG TCT ACA GTG AAA GAT GCC TAC TGC TTG CTG AAC TTC 
LTLRNMTMS PPAPSTVKDAYCLLNF> 

4910 4920 4930 4940 4950 4960 4970 

* • • • • • • 

GGG GAC AGC ATT ACT ACA GAT CAC ATT TCA CCT GCA GGA AGC ATA CAC AAA GAC AGT CCT GCT GCC AAG TAT TTG 
GDSITTDHI SPAGSIHKDSPAAKYL> 

4980 4990 5000 5010 5020 5030 5040 5050 

* * • * . » 

ATG GAG CGT GGT GTG GAC CGG AAG GAC TTC AAC TCA TAT GGT AGC CGT CGT GGT AAT GAT GAA GTA ATG GCA AGG 
MERGVDRKDFNSYGSRRGNDEVMAR> 

5060 5070 5080 5090 5100 5110 5120 

* ■ • • » » ■ 

GGA ACG TTT GCA AAC ATT AGG ATC GTG AAC AAG TTT TTG AAC GGA GAA GTT GGA CCC AAG ACC ATT CAT GTT CCT 
GTFAN IR IVNKFLNGEVGPKTIHVP> 

5130 5140 5150 5160 5170 5180 5190 5200 5210 

* » » ■*•••• 

ACT GGG GAG AAG CTT TCT GTT TTT GAT GCC GCC ATG GTATG TATTGTGAGG TTTTATTCCT TTTGCTTCTA TCAACGTGAC 
TGEKLSVFDAAM> 

5220 5230 5240 5250 5260 5270 5280 

• • • ■ * • ■ 

CTCCTAATAC CCATGGTCCG TACTGCAG AGA TAC AAA TCT CAG GGC CAT GCT ACT ATA ATC CTC GCT GGC GCT GAG TAT 

RYKSQGHATI I L A G A E Y> 

5290 5300 5310 5320 5330 5340 5350 5360 

• • • •* * » • 

GGA AGC GGC AGT TCT CGT GAT TGG GCT GCT AAG GGT CCG ATG CTC CTG GCA AGTTCTATTC AGAGTTTATG 
G S G S S R D W A A K G F M L L> 

5370 5380 5390 5400 5410 5420 5430 5440 

**■**• • • 

AGAATTTTAC CTTGTATCGG AAAACATATA GTATTCATTG ATGAGGTATG CATTGTTTTC AG GGA GTT AAA GCT GTA ATT GCC 

G V K A V I A> 

5450 5460 5470 5480 5490 5500 5510 

» » * • • * • 

AAG AGC TTT GAG CGT ATC CAC AGA AGC AAC TTG GTG GGG ATG GGA ATC ATT CCT CTT TGC TTC AAA GCT GGT GAG 
KS F E R I HR SN LVGMGZ I F LC F K A G E> 

5520 5530 5540 5550 5560 5570 55B0 5590 

• • *•• * • • 

GAT GCT GAT TCA ATT GGC CTC ACT GGT CAT GAG CGG TAC AGC ATC GAT CTC CCT ACC AAC CTC AGT GAG ATC CGT 
DADS IGLTGHERYSIDLPTNLSEIR> 

5600 5610 5620 5630 5640 5650 5660 

• • » * * * * 

CCC GGC CAG GAT GTG ACT GTT ACT ACC GAC AAT GGG AAA TCT TTC ACT TGC ATC GTT CGC TTT GAC ACT GAG 
PGQDVTVTTDNGKSFTC IVRFDTE> 

5670 5680 5690 5700 5710 5720 5730 5740 5750 

• • • ••*••• 

GTATA AGCATTTAAG AAGACATCTT TTAACCTTTC TAGCAGGTAT GCCATTTGCA TTGTTATTGA ACTAATCAAT CACCAATTCT 

5760 5770 5780 5790 5800 5810 5820 

» * * * * * » 

TGCTTTGTTC TAG GTG GAG CTG GCG TAC TTC AAC CAT GGA GGC ATC CTC CCT TAT GTC ATC CGC AAC TTG GCA GCT 
VELAYFNHGGI LPYVIRNLA A> 

5830 5840 5850 5B60 5870 5880 5890 5900 5910 

* •••*•*■■ 

GCC CAT AAC TGAGG CAAGATCACA CACCGTTTGA CCCACAATCG CAGTGGCAGG C TCC ATG TTC CCAGGGCTAG CGACCTGGTT 
A H N> 

5920 5930 5940 5950 5960 5970 5980 5990 6000 

CTCAATATAG TGACATTTGT GATGGATCTA GGGGTCTCTT TTGTCGATTC AGCCCATAAA TAAAGTGTGA AATAAAAGCC GCAGGTGGAG 

6010 6020 6030 

*• * * 

CCAGAACCTG CTGATTGAOG GAACACTTTT GCCTGT 
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FIGURE 19 

ZMACO 
ATACO 



33/36 



TV HAFKDILTSLPKPGGGEYGKFYSLPAL 

ASPTPLINFLSSENRSLYFASSLDLYLSSMASENPFRSILKALEKPDGGEFGNYYSLPAL 

* ** * ** *** * ****** 



ZMACO 
ATACO 



ND PR I DKL PYS VR I LLESAI RNCDNFQVTKNDVEKI IDWENTSPKLAEI PFK PARVLLQD 
NDPR I DKLPYS IR I LLESAI RNCDEFQVKSKDVEK I LDWEOTS PKQVE I PFKPARVLLQD 



ZMACO 
ATACO 



FTGVPAWDLAAMRDAMAKLGSDANKINPLVPVDLVIDHSVQVDVARSQNAVQANMELEF 
FTGVPAWDLACMRDAMNNLGGDSNKINPLVPVDLVIDYSVQVDVARSENAVQANMELEF 



ZMACO 
ATACO 



SRNKERFGFLKWGSSAFQNMLWPPGSGIVHQVNLEYLGRWFNTDGILYPDSWGTDSH 
QRNKERFAFLKWGSNAFHNMLWPPGSGIVHQVI^EYLARVVFNTNGLLYPDSVVGTDSH 



ZMACO 
ATACO 



TTMI DGLGVAGWGVGG I EAEATMLGQPMSMVLPGWGFKLTGKLRSGVTATDLVLTVTQM 
TTMI DGLG VAGWGVGG I EAERPMLGQPMSMVLPGWGFKLTGKLRDGMTATDLVLTVTQM 



ZMACO 
ATACO 



LRKHGWGKFVEFYGEGMGKLSLADRATIA^3MSPEYGATMGFNPVDHVTLDYLKLTGRSD 
LRKHGWGKFVEFHGEGMRELSLADRATIANMSPEYGATMGFFPVDHVTLQYLRLTGRSD 



ZMACO 
ATACO 



ETVSMIEAYLRANKMFVGYNEPPTERIYSSYLELNLDEVEPSMSGPKRPHDRVPLKEMKS 
DTVSMIEAYLRA^^CMFVDYSEPESICTVYSSCI£LNLEDVEPCVSGPKRPHDRVPLKEMKA 



ZMACO 
ATACO 



DWHACLDNKVGFKGFAVPKEQQDKWKFDFHGQPAEMKHGSWIAAITSCTNTSNPSVML 

DWHSCLDNRVGFKGFAVPKEAQSKAVEFNFNGTTAQLRHGDWIAAITSCTNTSNPSVML 
*** **** *********** ****** * ** ******************* 



ZMACO 
ATACO 



GAGLVAKKACELGLE\^PMVKTSIAPGSGVVTKYLLQSGLQEYLNQQGFHIVGYGCTTCI 
GAALVAKKACDLGLEVTCPWIKTSIAPGSGVVTKYIAKSGLQKYIJ^QLGFSIVGYGCTTCI 



ZMACO 
ATACO 



GNSGDFDESVSTA ITENDVVAAAVLSGNRNFEGRVHPLTRANYLASPPLVI RYRLAGTVD 

GNSGD IHEAVASA I VDNDLVASAVLSGNRNFEGRVHPLTRANYLAS PPLWAYALAGTVD 
***** * * ** *• ** **************************** * ****** 



ZMACO 
ATACO 



I DFEKEP I GFGKDGKEVYFRDIWPSTEEIAEWQSSVLPDMFKGTYEA ITKGNPMWNQLT 
I DFETQP I GTG KDGKQ I FFRDIWPSNKEVAEWQSSVLPDMFKATYEA ITKGNSMWNQLS 



ZMACO 
ATACO 



VREGSLYSWDSKSTYSMRKLTLRNMTMSPPAPSTVKDAYCLLNFGDSITTDHISPAGSIH 
VASGTLYEWDPKSTYIHEPPYFKGMTMSPPGPHGVKDAYCLLNFGDSITTDHISPAGSIH 



ZMACO 
ATACO 



KDSPAAKYLMERGVDRKDFNSYGSRRGNDEVMAR GTFANIRIVNKFLNGEVGPKTIH 

KDSPAAKYLMERGVDRRDFNSYGV AWMMRLWREHFANIRIVNKHLKGEVGPKTVH 



ZMACO 
ATACO 



VPTGEKLSVFDAAMRYKSQGHATIILAGAEYGSGSSRDWAAKGPMLLGVKAVIAKSFERI 
IPTGEKLSVFDAAMKYRNEGRDTIILAGAEYGSGSSRDWAAKGPMLLGVKAVISKSFERI 



ZMACO 
ATACO 



HRSNLVGMGI I PLCFKAGEDADSIGLTGHERYSIDLPTNLSEIRPGQDVTVTTDNGKSFT 
HRSNLVGMGIIPLCFKAGEDAETI^LTGQELYTIELPNNVSEIKPGQDVTVVTNNGKSFT 



ZMACO 
ATACO 



CIVRFDTEVELAYFNHGGILPYVIRNLAAAHN 
CTLR FDTEVELiAYFDHGGI LQYVIRNLI - -KQ 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 95/20046 



34/36 

FIGURE 20(a) 



PCT7EP95/00263 



ZMACO 
ATACO 
CMACO 



ZMACO 
ATACO 
CMACO 



TV HAFKDILTSLPKPGGGEYGKFYSLPAL 

ASPTPLINFLSSENRSLYFASSLDLYLSSMASENPFRSILKALEKPDGGEFGNYYSLPAL 

ndpridklpysvrillesairncdnfqvtkndvt:kiidwentspklaeipfkparvllqd 
ndpridklpysirillesairncdefqvkskdvekildwentspkqveipfkparvllqd 



ZMACO FTGVPAWDLAAMRDAMAKLGSDANK I NPLVPVDLVI DHSVQVDVARSQNA VQANMELEF 

ATACO FTGVPAVVDIACMRDAMNNLGGDS^INPLVPVDLVIDYSVQVDVARSENAVQAN^LEF 

CMACO : HEAKTENAVQANMELEF 

* ^ m *********** 

ZMACO SRNKERFGFLKWGSSAFQNMLWPPGSGIVHQVNLEYLGRVVFNTDGILYPDSVVGTDSH 
ATACO QRNKERFAFLKWGSNAFHNMLWPPGSGIVHQVNLEYLARWFNTNGLLYPDSWGTDSH 

CMACO KRNRERFGFLKWGSSAFHNMLWPPGSGIVHQVNLEYLGRWFNTNGLLYPDSWGTDSH 

** *** ****** ** ******************** ****** * ************ 

• • • • • • • 

ZMACO TTMIDGLGVAGWGVGGIEAEATMLGQPMSMVLPGWGFKLTGKLRSGVTATDLVLTVTQM 
ATACO TTMIDGLGVAGWGVGGIEAERPMLGQPMSMVLPGWGFKLTGKLRDGMTATDLVLTVTQM 

CMACO TI^IDGLGVAGWGVGGIEAEAAMLGQPMSMVLPGWGFKLVGKLRNGVTATDLVLTVTQM 

******************** ****************** **** * ************ 

• * • • 

ZMACO LRKHGWGKFVEFYGEGMGKLSLADRATIANMSPEYGATMGFNPVDHVTLDYLKLTGRSD 
ATACO LRKHGWGKFVEFHGEGMRELSLADRATIANMSPEYGATMGFFPVDHVTLQYLRLTGRSD 

CMACO LRKHGWGKFVEFYGEGMGELSLADRATI ANMS PEYGATMGFF PVDHVTLQYLKLTGRKD 

************* **** ********************** ******* ** **** * 
• • • • . 

ZMACO ETVSMIEAYLRANKMFVGYNEPPTERIYSSYLELNLDEVEPSMSGPKRPHDRVPLKEMKS 
ATACO DTVSMIEAYLRANKMFVDYSEPESKTVYSSCLELNLEDVEPC^SGPKRPHDRVPLKEMKA 

CMACO ETISMIESYLLANKMFVDYSEPQVERVYSSHIELNLSDVEPCISGPKRPHDRVPLKEMKA 

* **** ** ****** * ** *** **** *** **************** 

••• ••••••••• • 

ZMACO DWHACLDNKVGFKGFAVPKEQQDKVVKFDFHGQPAEMKHGSWIAAITSCTNTSNPSVML 
ATACO DWHSCLDNRVGFKGFAVPKEAQSKAVEFNFNGTTAQLRHGDWIAAITSCTNTSNPSVML 
CMACO DWHACLDNRVGF KGF A I PKEAQVKVAEFNFHGS PAQLRHGDWI AA I TSCTNTSNPS VML 

*** **** ******* *** * * * * * * ** ******************* 

• • • • 

ZMACO GAGLVAKKACELGLEVXPWVKTSLAPGSGVVTKYLLQSGLQEYLNQQGFHIVGYGCTTCI 
ATACO GAALVAKKACDLGLEVKPWIKTSLAPGSGVVTKYLAKSGLQKYLNQLGFSIVGYGCTTCI 
CMACO GAALVAKKACELGLEVKPWI KTSLAPGSGWTKYLAKSGLQKYLNQLGFNI VGYGCTTC I 

********* ^ ******** b *************** # ****^**** ** ********** 

v ZMACO GNSGDFDESVSTAITENDWAAAVLSGNRNFEGRVHPLTRANYLAS PPLVI RYRLAGTVD 

ATACO GNSGDIHEAVASAIVDNDLVASAVLSGNRNFEGRVHPLTRANYLASPPLWAYALAGTVD 

CMACO GNSGDIDESVASAITGNDIVAAAVLSGNRNFEGRVHPLTRANYLiASPPLWAYALAGTVD 
***** * * ** ** •** **************************** * ****** 

ZMACO IDFEKEPIGFGKDGKEVYFRDIWPSTEEIAEWQSSVLPDMFKGTYEAITKGNPMWNQLT 
ATACO IDFETQPIGTGKDGKQIFFRDIWPSNKEVAEWQSSVLPDMFKATYEAITKGNSMWNQLS 

CMACO IDFESEPIGVGKEXjKKVFFRDIWPTSEEVAVVWSNVIjPDMFRATYQAITEGNATWNLLS 

**** *** ***** ****** ***** ****** ** *** ** ** * 
* • • • • ■•«• • • ••. . . . 
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ZMACO VREGSLYSWDSKSTYSMRKLTLRNMTMSPPAPSTVKDAYCLLNFGDSITTDHISPAGSIH 
ATA CO VASGTLYEWDPKSTYIHEPPYFKGMTMSPPGPHGVKDAYCIiLNFGDS ITTDHI SPAGS IH 

CMACO VPEGTLYSWDPTSTYIHEPPYFKDMSMSPPGPHGVKNAYCLLNFGDSITTDHISPAGSIH 
* * ^ ** ^ * * ^ t ** * ************************* 

ZMACO KDSPAAKYLMERGVDRKDFNSYGSRRGNDEVMAR GTFANIRIVNKFLNGEVGPKTIH 

ATACO KDS PAAKYLMERGVDRRDFNS YGV AVVMMRLWREHFANI RI VNKHLKGEVGPKTVH 

CMACO KDS PAAKYLLERGVDRRDFNS YGV A WMMRLWHVHF ANI R I VNKLLKGEVGPKT I H 

********* ( ****** ( ****** ^ ** * ********* *^*******^* 

ZMACO VPTGEKLSVFDAAMRYKSQGHATIILAGAEYGSGSSRDWAAKGPMLLGVKAVIAKSFERI 
ATACO IPTGEKLSVFDAAMKYRNEGRDTIILAGAEYGSGSSRDWAAKGPMLLGVKAVISKSFERI 
CMACO IPSREKLSVFDAAMRYKSEGQDTIILAGAEYGIGSSRDWAAKGPMLLGVKAVIAKTFERI 
* ********** .* m m # * # m ********** ********************.*.**** 

ZMACO HRSNLVGMG 1 1 PLCFKAGEDADS I GLTGHERYS I DLPTNLSEI RPGQDVTVTTDNGKS FT 

ATACO HRS^VGMGIIPLCFKAGEDAETLGLTGQELYTIELPNWSEIKPGQDVTWTNNGKSFT 
CMACO HRSNLVGMGIIPLCFKAGEDADSLGLTGHERFTIDLPSNVGEIRPGQDVAVVTDTGKSFS 
********************* **** * * **************** 

ZMACO C I VRFDTEVELAYFNHGG ILPYVI RNLAAAHN 

ATACO CTLRFDTEVELAYFDHGG I LQYVI RNL I - - KQ 

CMACO CILRFDTEVELAYFDHGGILQYVIRNLIHSKH 



v 



9 
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